在IT业界用闪存取代传统硬盘已经成了其发展趋势。但是斯坦福大学的一个研究小组进一步提出:DRAM才是传统硬盘的“终结者”。
为了实现这一目标,这个研究小组正在开展一项名为“RAMCloud”(内存云)的项目,它能够聚合上千台服务器的内存,从而极大地提高数据访问速度。
由于DRAM一旦断电就会丢失数据,硬盘(或许还有闪存)仍可用于数据备份。但在日常运行中,所有信息应用访问都直接来自DRAM。
对于RAMCloud所面临的潜在障碍,项目负责人、斯坦福大学计算机系教授约翰欧斯特霍特(John Ousterhout)也并不避讳。他表示,障碍之一是超低延迟网络的发展现有网络性能需在未来三五年内取得极大进步,RAMCloud才能有用武之地。
但是RAMCloud一旦成功,也将带来巨大的收益。DRAM价格昂贵,但是它的速度比闪存快5-10倍,比传统硬盘快100-1000倍。而企业 使用传统机械硬盘时,很少会把硬盘的存储容量塞满,但却在数据访问速度上备受限制。所以尽管DRAM每字节的存储成本比硬盘贵50-100倍,但欧斯特霍 特教授认为,DRAM的每次读写操作成本依然低于硬盘。
一些厂商已经认识到DRAM的性能优势,其实VoltDB等数据公司已经建立了内存型数据库,主要用于某些交易繁多的专业应用。欧斯特霍特相信,随着技术发展和价格下降,DRAM未来将有更广泛的用途。
RAMCloud:数据新家园
2009年12月和2011年10月发表的两篇论文,描述了RAMCloud在数千台服务器和数百TB数据上的应用。 2009年的论文中写道:“所有信息一直保存在DRAM中,DRAM是数据的永久家园,而磁盘仅用于备份。”此外,RAMCloud必须自动形成一定规 模,从而支持数以千计的存储服务器;应用程序所看到的只有存储系统,而与存储服务器的数量无关。该论文称,装有RAMCloud的网络每秒钟可处理100 万次服务请求。
现在,欧斯特霍特和和他的研究团队已经做出了由80台各装有24GB DRAM的服务器组成的2TB原型系统,虽然离目标还有一定差距,但是它一旦遇到系统崩溃,仅需5微秒就能恢复基本的读取操作。研究团队从一年半以前开始 为该系统编写代码,但是该系统的“1.0版”仍需6到12个月才能投入商业使用。
欧斯特霍特认为RAMCloud系统的首批用户,会是那些在创建前沿互联网应用程序时受到存储系统局限的团队对于他们而言,传统数据库不能保障数据 的实时访问。例如Facebook这样的网站,就很可能从RAMCloud中受益,欧斯特霍特表示他已经和Facebook的高管进行过相关讨论。普通用 户或许感觉不出什么区别,但Facebook网页上生成的显示内容,的确受到了数据访问速度的限制。“他们现在受到很大局限,因为他们没有足够快的存储系 统。”
但是,就算技术已经成熟,Facebook也不可能在一夜之间将其存储系统全部换成RAMCloud。不过欧斯特霍特表示,他们团队的研究工作已经 吸引了一些闪存设备厂商和存储系统公司。欧斯特霍特认为,从长远来看,RAMCloud有望被用于亚马逊Elastic Compute Cloud或者Windows Azure等云网络,甚至被用于企业数据中心。
磁盘将被取代
研究机构Enterprise Strategy Group(企业战略集团)的创始人兼高级分析师史蒂夫?杜普雷西(Steve Duplessie)认为,未来存储系统终将抛弃机械硬盘,但这一淘汰过程需要多长时间,还是一个未知数。“与其说这是一个技术问题,不如说这是一个经济 学问题。这取决于我们何时能降低成本、让它变得更实用。
SSD(固态硬盘)产业近年来方兴未艾。虽然将全部传统磁盘替换成固态硬盘的花费过于高昂,但是在分级系统中将传统硬盘与闪存联用,再利用数据压缩与重复删除技术,是一种既有效又可行的方法。杜普雷西表示:“虽然才刚刚开始,但是这是世界性的发展趋势。”
RAMCloud是一种大胆创新,不过最近被戴尔收购的RNA Network公司也曾经提出过类似的构想RNA Network曾试图汇聚所有服务器的DRAM,创建一个每台服务器都能访问或被访问的超大虚拟DRAM。但是,这一构想目前还没有实现商业化。
虽然DRAM价格昂贵,但是杜普雷西指出,现在的数据中心DRAM利用率很低,很多DRAM都被闲置。他表示:“既然已经买了它(DRAM),就该好好利用起来。”
欧斯特霍特表示,几年之内,RAMCloud所适用的服务器将拥有多达256GB的DRAM。他相信RAMcloud不是那种停留在论文和简易原型阶段的“典型研究项目,我们希望它能得到广泛的应用。”