数字数据呈倍数成长并非新鲜事,推动这个趋势背后的力量才是;而在摩尔定律(Moore’s Law)已经55岁之后,我们已经不一定要看到处理器性能的进一步提升才能跟上这个趋势──专为数据储存量身打造的处理器会是一种解决方案。
一家成立于2017年的新创公司Pliops总裁Steve Fingerhut表示,拜大数据、人工智能(AI)、物联网(IoT)与5G等技术之赐,市场对数据储存的需求持续成长,而且有越来越多数据被移到固态硬盘(SSD)储存;估计在接下来十年,数据中心对SSD的采用率将成长100倍。
“SSD有很多优势,其中最主要的就是超越传统硬盘机(HHD)的性能;”他表示,SSD的成本在过去十年间持续下降,同时性能仍不断提升,而且因为非挥发性内存(NVMe)技术领域发展蓬勃,其功能也有所扩展。
不过Fingerhut指出,储存技术突飞猛进,处理器的性能提升速度却没跟上,甚至成为一个瓶颈;像是Intel、AMD等公司一直为处理器添加核心,带来了额外的成本与功耗,效益却不彰;“当你添加越来越多个核心,但共享同一个内存总线,这就会是个大问题。”
而所有不断增加的数据将储存在高速的SSD上,他表示:“需要处理器来驱动,处理器技术进展的速度却没有那么快。”
SSD资料存储也可以使用专属处理器
Pliops储存处理器是一种基于关键值的储存硬件加速器,能与任何一种SSD搭配,分担工作负载并优化SSD的使用。(图片来源:Pliops)
针对以上“储存堆栈效益不彰”的问题,Pliops提出的是一种针对数据库和软件定义储存中特定工作负载之数据加速技术;该公司估计这类工作负载占据企业与数据中心基础设施日常任务的一半。
其Pliops储存处理器(Pliops Storage Processor,PSP) 是一种基于关键值(key-value,KV)的储存硬件加速器,能让云端与企业客户分担并加速数据密集的工作负载,让数据中心能在降低运算负载与耗电的同时能持续扩大规模。
Fingerhut 表示,PSP不只能改善工作负载性能,也能优化SSD的使用;典型的应用案例包括Facebook偏好的mySQL数据库,还有越来越受欢迎却价格高昂、以DRAM为基础的Redis。数据库通常仰赖一个储存引擎透过排序(sorting)与索引(indexing)来“放大”数据,因为数据写入SSD的速度比应用程序所需的速度高出40倍。
他解释:“最后你会使用更多的磁盘空间,占据更多SSD容量,甚至多到2~7倍;这些放大效应是因为架构师尝试限制CPU的消耗所致;”而PSP处理储存与特定数据库处理挑战的方法,有点像是针对特定工作任务的AI/机器学习加速器,对相对较新的任务负载有利。
总的来说,PSP对数据库带来的技术性优势,包括能提升3倍到10倍的每秒查询率(queries per second),并号称可降低93%的查询延迟;Fingerhut并指出,PSP能降低功耗与对SSD容量的需求,这也就意味着成本的降低。
Pliops没有卖闪存,也不卖SSD;Fingerhut表示PSP能搭配任何SSD与各种接口,该公司也在考虑将技术在FPGA上实现。他指出,Amazon (AWS)与Microsoft Azure最近都宣布了自家开发的数据库加速器;“这与我们正在做的东西焦点稍有不同,但也显示竞赛已经开始,我们都是朝着同一个方向迈进。”
数据储存顾问机构Coughlin and Associates总裁Tom Coughlin表示,朝向分担负载功能与专属运算储存加速器技术的趋势,突显了CPU速度无法像以前进展那么快的现实;“专用处理器实际上变得很重要,”例如GPU、张量处理器以及网络专属处理器等都是类似的案例。
Coughlin指出,Pliops的PSP是利用了一种专门布署的KV技术,实际上已经存在一段时间,甚至在五年前就曾被用在Seagate的某一系列硬盘机产品;但该技术并未起飞。
关键词标签:海量存储 文件存储 分布式存储 国产存储 私有云 企业级存储 软件定义存储