数据中心不断增加的工作量要求使用新的方法来存储和访问数据。韩国大邱庆北科技大学的研究人员开发了一种新方法来管理固态驱动器中的数据库,从而显着改善了读写延迟性能,并从CPU上卸载了数据库计算任务,从而提高了效率并降低了功耗。
随着Web服务,云存储和大数据服务的不断扩展,它们所依赖的庞大的硬件基础架构(称为数据中心)需要进行改进以适应当前的需求。一种用于提高性能并减少与读写大量数据相关的能量负荷的有前途的解决方案是赋予存储设备某些计算能力,并从CPU卸载部分数据读写过程。
韩国大邱庆北科技大学(DGIST)的研究人员在2020年USENIX年度技术会议上发表的最新研究中,描述了在固态硬盘(SSD)中实现键值存储的新方法,该方法提供了许多与更广泛使用的方法相比具有优势。
键值存储(也称为键值数据库)是一种以键值对形式存储,管理和检索数据的方法。最常见的实现方法是使用哈希函数,该算法可以快速将给定密钥与其关联的存储数据进行匹配,以实现快速的读/写访问。
实现基于散列的键值存储的主要问题之一是散列函数的随机性偶尔会导致读/写操作中的长时延(延迟)。为了解决这个问题,DGIST的研究人员实施了另一种范例,称为“日志结构合并树(LSM)”。这种方法依赖于对数据进行分层排序,因此在最大延迟上设置了上限。
在其实现中,绰号为“ PinK”,他们解决了基于LSM的SSD密钥值存储的最严重限制。通过优化的内存使用,保证的最大延迟以及用于从CPU卸载某些分类任务的硬件加速器,PinK代表了数据中心SSD数据存储的一种新颖而有效的方法。主持这项研究的李成进教授表示:“键值存储是广泛使用的基础架构,可用于各种应用程序,包括Web服务,人工智能应用程序和云系统。我们相信PinK可以极大地改善用户感知的性能这些服务。”
到目前为止,实验结果证实了这种新实现方式所提供的性能提升,并突显了让存储设备自行计算某些操作的潜力。Lee教授总结说:“我们相信我们的研究为应该如何设计和构建计算存储设备以及应该解决哪些技术问题提供了一个很好的指导。”