没有人用赛车运干草,也没有人在赛道上开拖拉机。每种交通工具都有自己的特性,使用范围和价位。面对不同的工作应该选用正确的工具。数据存储也遵循同样的原则。我们应该选择不同的存储类型满足不同的存储需求。
分层存储的必要性
每个企业都有数量庞大的信息需要处理,其中大部分最后都要存起来。现在,客户读取历史记录胃口在无限量膨胀,公司因为数据读取和业务需要对信息量的需求也在不断增加,因此,需要存储的数据只会越来越多。而且会持续以指数级速度增长。《科学》杂志近期刊登了一篇由Hilbert和Lopez撰写的报道(见2011年4月1日出版的《科学》60-65页),报道称2007年全球电子数据的存储量是276EB(1EB等于10亿GB)。思科公司的一份题为“思科视野中的网络指标:全球移动数据流量最新预测,2010-2015”的白皮书指出,不久的将来,仅移动通信数据量每月就将达到几EB。到2015年,视频数据量将占这些数据总量的66%,而且,按照我们现在的使用模式,很多视频数据将被多次重复存储。
如果思科公司所说的增长速度将保持平稳,那么到2022年,仅每月产生的移动信息量就将超过2007年全年全球的数据存储总量。当然,其中会包括像“跳舞的小孩”这样的视频,但与之相对应地,存储库里也会保存银行数据,加密健康记录和销售网点数据库等非常重要的信息。如果调出一个“跳舞的小孩”视频要花15秒,没多少人会介意。但对于文件读取请求而言,15秒的反应时间对客户来说会像是一个世纪那么漫长,长此以往,公司会被 “慢”死掉。有些信息就是要能即用即取,而其他数据则可以放在相对更慢更便宜的存储区。你可以把它想成温度,保存最快最重要的数据为“热”,保存最慢最不重要的数据为“冷”。
“如果你是一条航线,有人想预定一趟航班,那么让对方快速查到航班时刻表并完成预定操作会让客户心情愉悦。”希捷公司高级产品营销经理Teresa Worth说。 “航班预定一旦成功,航空公司也收到了机票费,那接下来航线数据就可以从 “热”转为“温”了。如果客户想换航班,查询座位号或其他信息,客户肯定还是希望速度够快,但这时就不再是那么“热”了,因为航空公司和该客户的交易已经完成。航班飞过后,数据就可以变“冷”或近线存储了。当然数据仍需保持在可以被查询的状态,因为客户也许想在年末查询当年的飞行里程,并确定他们的这次飞行拿到了积分,但这时候让他们稍微等等也没有什么大问题了”
就像做饭一样,温度就是一切。或许还是跟做饭一样,热的材料最受关注,但做饭用到最多的还是那些冷的,放在冰箱冷藏和冷冻室里的材料。热存储一般都存在容量较低的驱动器中,而冷存储驱动器通常存储的数据则要多出好几倍。这就形成了某种动态的平衡,你必须在设计分层存储时考虑到这个因素。一个公司分层存储时采用了何种方法对公司的经营收益会产生重要影响,甚至关乎着公司的存亡。
分层模型更新
分层存储这个想法已经出现几十年了,但因为存储技术的不断发展,这个想法的细节也在因此不停的更改。更改集中在中间层和存储架构上。
这里说的中间层是指选用的存储媒介。磁盘存储,也就是硬盘驱动器以前既被用于交易型存储(热)也被用于近线存储(温),而磁带则主要被用来归档(冷)这三种存储的具体含义如下:
交易型存储。指用于高速和大量商务交易的数据。交易型数据常常和产生利润的业务直接挂钩,对公司生计有着决定性的作用。
近线存储。以上述航班的例子为例,近线数据就是指那些从即时读取降级成快速读取的信息。它就像是放在档案柜的卷宗,而不再是摆在桌子上的棘手文件。你仍然能快速方便的找到它,但得稍微多花点时间。虽然时间成本增加了,但换回来的是存储媒介成本的大幅下降。
归档存储。不久,你的档案柜存满了。这时,企业常常会找出最老的文件,把它们装箱然后放到像地下室或仓库这样的冷存储室里。这就是归档。如果方法得当,所有的数据将仍然被有序存放,但很明显,想找到具体某个箱子查找到其内容会花更长的时间。随着每GB磁盘存储价格的下降,磁盘在不断入侵并占领磁带的市场,结果就是近线和归档存储之间的界限越来越模糊了,但磁带在企业归档市场中,尤其是在备份/故障恢复应用方面仍然处于统治地位。这说明,在基于磁盘的系统当中,磁带库也能被虚拟化和使用。
随着固态磁盘驱动器的普及,很多人正在注意到金字塔尖还有一个新的存储层:Tier 0。
“Tier 0是专属于SSD的,它涉及到的工作任务最重,占空比、耐久力和性能稳定性最大” 希捷公司高级产品营销经理Teresa Worth 说。 “ Tier 0上的信息都是和交易及IOPS相关的。更快地完成交易能让公司挣更多钱,或者提升顾客的满意度,进而增加公司的竞争力。”
如果想完整的解释存储架构,可能需要有一篇专门的文章。小企业用直连方式和网络连接(DAS和NAS) 这两种存储可能就能很好的运作起来,这两种存储一般会分别选择eSATA 或 USB 3.0再加以太网,我们知道这些就够了。但是这些连接的性能和可扩展性都受到了某种程度的限制,因此不适用于较大的存储。而事实上,在上世纪90年代及本世纪最初几年里,存储区域网(SANs)的光纤通道技术已经标准化了。光纤通道的成功在很大程度上是源于对协议的宽容性。IP, iSCSI, ATM和其它协议都能在该网络中运行,效率也都一样。
现在,作为一种网络技术,光纤通道能产生的最大传输速度是8 Gb/s 或16 Gb/s,但驱动器接口的最大速度则仅为4 Gb/s。对于企业来说,这样的带宽够用了,但以太网的潜在带宽是10 Gb/s,而且以太网有价格优势和更广泛的使用范围,因此光纤通道将很快面临压力。过去高速以太网的致命弱点是它的高价位以及由此对系统资源产生的影响,但网络适配器中出现了TCP卸载引擎,它与更强有力的CPU结合后,高成本的问题已经基本得到了解决。这项技术加速了光纤通道在架构和存储驱动器两个层面的衰落,为以太网的iSCSI扫清了障碍,最近,因此受益的又变成了串行并列SCSI(SAS)。和光纤通道一样,驱动连接器和存储网络互联都在用SAS,SAS因此变成了现在最高性能分层存储的最佳解决方案。我们很快将跟进一篇专门讲述SAS的文章。
分层存储服务器选择
大多数分层存储都会用到某种类型的存储服务器。表现形式一般是:将单机服务器系统连在被称为JBODs(“就是一摞盘”)的外接存储箱上。这时,一个JBOD跟一个连在类似SAS接口上的装有基架的磁盘柜差不太多。The JBOD attaches这个JBOD反过来又跟服务器相连,服务器里会包含一个存储控制器,该控制器能进行RAID操作并将磁盘阵列连接到一个更大的SAN结构中。下图展示的Xyratex RS-1600-FC2就是一个JBOD磁盘柜。
还有另外一种方法:有些企业喜欢把控制器/服务器和驱动器装在同一个磁盘柜里。一种常见的设计是使用12个热插拔的3.5”驱动器,配合一个服务器平台和3 Gb/s 的SAS结构,然后把它们装在一个3U的磁盘扩展柜。存储器制造商们生产的磁盘柜有7U的,甚至还有能装载超过60个3.5”驱动器的8U磁盘柜,见下图所示的双面STX XS62-2810。
很明显,存储服务器的性能如何以及能否找到正确的目标层取决于使用了哪种存储处理方法和驱动技术。装有6 Gb/s SSDs 的最先进的Xeon 5600平台将被应用于Tier 0,而基于SATA的JBOD如果和三年前研发的单CPU相连之后,则更适用于Tier 2。现在的分层技术中有一些模糊的地方,其中大部分都是和Tier 1有关的。Tier 0需要可观的预算作支持,才能挖掘其性能的最大潜力,而Tier 2常常被用来平衡可靠性,容量和价格。前些年谈到这个话题的时候,我们的选择似乎还只局限于两种:也就是只需要在最快的SCSI 3.5”硬盘驱动器和最大的PATA或 SATA 3.5”硬盘驱动器之间作权衡。而现在,需要考虑的因素增加了很多。
这篇文章中表达的想法是和头三级驱动器存储相关的,也就是从交易存储到近线存储。这里的讨论中我们可以忽略磁带,而把目光聚焦在两种主要存储类型,它们的形状系数及其它一些需要考虑的问题上,这些因素在为分层存储方案选择驱动器时都需要考虑到。应用程序过去一直是被磁带和光盘统治的,不过,我们应该注意到,把磁盘也纳入考虑范畴将越来越有其必要性。一篇由企业存储集团撰写苹果公司发起的题为“分层存储蓝图”的论文说道:在磁盘,磁带和虚拟磁带解决方案之中,“故障恢复的失败率平均为40%。” 究其原因,在部分程度上问题就出在企业所存的数据的量上,以及存储大量数据时非磁带不选。在Tier 3选择相对更慢但更可靠的、又能保护RAID的硬盘存储能显著降低深层存储器中数据毁坏的风险。
SSD 驱动器选择:SSD
梯形存储的顶层是SSD,它的形状系数一般都是2.5”。现在,SSD将NAND 闪存作为其存储媒介而不是硬盘驱动器转盘来使用,对此你肯定已经不再陌生了。不过,NAND 存储器有两种:单层式存储(SLC) 和多层式存储。单层和多层代表的是每个存储单元里可放置的信息单元(bit)数。多层式存储(MLC)的优点是每个单元能存储更多数据,因此单个NAND芯片的总容量更高,但这是以牺牲速度和使用寿命(系统失效前闪存单元可执行的写循环次数)为代价的。
通常来讲,SLC的每个存储单元里可进行约10万次读写。2-bit MLC每个单元能接受的读写次数只有大约一万次,而到了3-bit MLC就仅剩一千次了。不过请记住,SSD中能进行数据写入的逻辑单元块有上百万个,而且,写入算法一直在发展,因此写入次数也在不断增加。随着容量,速度,读写次数的增加,基于MLC的SSD正在受到企业界越来越多的青睐,而且有望成为未来Tier 0市场的主力军。不过,SLC技术仍然是Tier 0应用程序中的首选。
在企业存储市场中,SSD是如何被使用的呢?通过希捷公司的Pulsar系列产品,我们可以对此有个更清晰的认识。目前有三种Pulsar 产品:Pulsar, Pulsar.2和 Pulsar XT.2。早先的Pulsar 驱动器使用的SLC NAND容量分别有50, 100和200 GB,它们使用的都是3 Gb/s的SATA接口。 Pulsar.2使用MLC,容量从100到800GB不等。接口既可以选择6 Gb/s SAS 也可以用6 Gb/s SATA,并且希捷还提供了加密功能。对那些对数据安全要求较高,尤其是法律上对此有强制性要求的企业而言,加密功能是非常关键的。加密功能将确保所有写入磁盘的文件都得到AES的保护,没有特定权限的人都不能进入。Pulsar XT.2使用了容量为100, 200和400 GB 的SLC存储器,接口则只能选用SAS 6 Gb/s,型号有加密和不加密两种。
Tier 0目前使用的仍然是SLC SSD,因为交易型存储系统每秒产生的数据请求可能会多达几百,甚至几千个,因此写入次数在这一级至关重要。这也是为什么尽管SSD性能表现非常高,一些企业公司在遇到重要应用程序时,仍然依赖硬盘的原因,因为硬盘是业界公认的MTBF 评级标准较高的产品。一般说来,同样花一美元,SSD可实现的IOPS是企业硬盘驱动器的20倍。 HDD大约是它的10倍。用哪个技术更好呢?答案不是固定的。不同的公司应该根据自身的需求和特点,对各项技术的优缺点进行权衡之后作出选择。
驱动器选择:3.5英寸机械硬盘
和Pulsar 系列产品一样,企业硬盘驱动器市场上也有SAS和SATA两种选择。此外,还可根据规格尺寸(2.5英寸 或 3.5英寸)、容量和磁盘转速来划分硬盘驱动器。出于方便的考虑,我们来看一下最先应用于传统的希捷3.5”企业驱动器系统时,这三项参数以及它们与各分层的结合情况。
希捷存储栈的底层用的是Constellation系列,该系列包括Constellation ES和Constellation ES.2。两种型号的转速均为7200 RPM,且都有加密版本。Constellation ES的容量有500 GB, 1 TB和2 TB,并且可以选择16, 32和64 MB三种高速缓存。用户可以选择购买3 Gb/s SATA, 6 Gb/s SATA或6 Gb/s SAS三种接口。Constellation ES.2有6Gb/s SAS 或 SATA两种,并且以最高3 TB的容量配以 64 MB高速缓存为亮点。但Constellation ES 和 Constellation ES.2都标榜有120万小时的MTBF评级(0.73%的年故障率),这也说明,尽管Constellation ES的容量较低,但传输速度能保持在147 MB/s,而Constellation ES.2最多也只有155 MB/s。这是源于两种型号面密度的不同(数据存储在磁盘上的密集程度):Constellation ES的324 Gb/in2 VS Constellation ES.2的444 Gb/in2。
很明显,Constellation家族的性能和容量刚好契合Tier 2。
Constellation家族里还有一款每分转速为7200 RPM的2.5英寸产品,有1 TB, 500 GB和 250 GB三种容量。跟Pulsar SSDs,Savvio 15K和 10K高性能驱动器一样,这个小巧驱动器也能放入2.5-inch的分层存储设备中,这一优点让Tier 2多了一个高容量又划算的选择。
说到Cheetah NS, 这个形状系数3.5英寸转速1万的驱动器时,如何给它归类就没那么好预测了。关于这个驱动器,先撇开规格不说,你首先注意到的可能是它的托盘大小和一个2.5”驱动器是一样的。它的小直径让它有了具备更高转速的可能。NS 10K 的类型有300, 450和 600 GB三种。无加密功能,但用户可以在4 Gb/s光纤通道和6 Gb/s SAS两种接口之间进行选择。
可以预见到,Cheetah 15K也具备了上述功能,直径尺寸依然很小,但它的转速达到了15 000 RPM—目前为止最高的转速。容量跨度从73.4 到600 GB不等,每种都带有16 MB高速缓存。4 Gb/s光纤通道或6 Gb/s SAS有更高存储容量的型号。
SSD普及之前,最高层存储都选择像Cheetah 15K这样的驱动器。而现在,你可以考虑更多的因素并评估过IOPS性能和额定功率后再做选择。
HDD 驱动器选择:2.5英寸机械硬盘
近几年,2.5英寸驱动器(15mm高)越来越受企业存储的青睐,部分原因是它们具有较高的存储密度和能效。尽管单个2.5英寸驱动器的容量可能比3.5英寸的要低,但因为它身材小巧,所以相同的存储空间中能配置更多驱动器。就像IBM在其存储著作中所指出的,2.5英寸驱动器能“在在同样大小的空间里几乎多装90%的驱动器”并“减少40%的存储空间需求量”。因此,一样大小的存储空间中,可以存储更多的数据,并实现更高的总体性能。
希捷的2.5英寸企业级HDD 最早用的是Constellation 和Constellation.2,其中Constellation.2尤其代表了最新一代的近线磁盘存储技术。6 Gb/s SAS和SATA的容量都达到了1 TB,都可以选择6Gb/s SAS和SATA两种接口,并且驱动器转速都是7200 RPM。该系列有具备加密功能的型号以及140万小时的更高的MTBF。(0.62%的年故障率,超过了它的同门3.5英寸)。
2.5英寸HDD圈的核心是我们的Savvio 10K系列产品,它提供了性能和容量的最佳结合,该系列产品中个个都具备了200万小时的MTBF(0.44%的年故障率)以及10 000 RPM的转速。最新的Savvio 10K.5的容量达到了300到900 GB,这要归功于它506 Gb/in2 的面密度。 This also enables a 168 MB/s sustained transfer rate across the drives’ 6 Gb/s SAS interface. 这一特点也让该驱动器的6 Gb/s SAS 接口具备了168 MB/s的持续传输率。
不过,希捷公司小型硬盘驱动器的制胜法宝还是Savvio 15K.3。这款驱动器有146 GB 和300 GB两种型号,使用15 000 RPM转速以及6 Gb/s SAS接口,持续传输率刚勉强达到200 MB/s。
现在,Tier 1存储实际上是由Savvio系列产品来定义的。它的存储密度最大,同时还使用一款高速又便宜的SAS 接口。想要什么样的性能可以根据预算来平衡,因为15K 驱动器具备了所有最好的优点,除了在Tier 0级移至SSD之外。这一概念总体适用于分层式存储。抛开价格谈性能是不现实的,因为分层式存储的终极目标始终是:只要条件具备,就将使用率更低的数据存入成本更低的存储媒介。
节能
随着电力成本的上涨,各方对提高能效所施加压力的增加,人们越来越关注存储驱动器的耗电量。如果单拿一个来看,一个5W和8W 600 GB驱动器的区别可能只是这两个数字的区别,但如果是1000个驱动器在随着时针运转,这3W的区别就是每年几千美元的能耗差距了。
人们普遍认为SSD比硬盘驱动器更节能,如果是从每秒I/O操作数这个指标来看的话,这种想法当然没错。 但不是所有的应用程序都把IOPS 视作主要的衡量标准。400 GB Pulsar XT.2是现在最先进的型号,它的平均耗电是6.67W,而2.5” 500 GB Constellation.2是5.48W,也就是说每个驱动器容量高100GB的情况下还能节电近2W。是的,这两种驱动器的性能和价格悬殊很大,但当预算和密度的优先级比性能更高的时候,比如以一般的Tier 2存储为例,Constellation.2在绿色节能方面就是最佳选择。
为了研发让企业级驱动器能效实现最大化的技术,希捷公司已经花了几年的时间。几年前,Barracuda ES和Cheetah 15K 3.5英寸驱动器最先拥有了被称为PowerTrim的功能,当驱动器的某些区块没有存取操作的时候,PowerTrim可降低这些区块的耗电量。希捷公司现在已经采用了T10/T13委员会公布的标准,他们对该标准进行修订后将其命名为PowerChoice,首先由Savvio 10K.4, Constellation和Constellation ES系列使用。
PowerChoice 理论上是非常适用于二级存储的,因为驱动器的闲置时间最低从1秒起长短不等的时候,PowerChoice就派上用场了。如下图所示,一小时的休止状态将启动Standy_Z 模式,将耗电量降到仅为1.29W,用电因此会节省54%。这将触发大约8秒的起转时间,但是我们需要强调的是,这是近线数据,如果需要等待8秒以上的话,最好是像5年前的航班记录这样的数据。
这四种闲置模式会在驱动器内触发不同的程序。比如,模式A和B将保持磁盘以全速转动,但A可以减少驱动器处理器的能耗,而B则会将磁头移到驱动器斜面上。模式C 会降低RPM 率,而D会让系统彻底停下来。请注意,管理员可以根据用户需求定制这些驱动器的计时和电力过度状态,从而将驱动器调整到最适合用户系统环境的状态,实现系统性能的最优化。
耗电量会直接影响总体运营成本,是评价一项完整分层式存储技术的关键指标。
ILM和成本回收
企业或组织一旦确定了自身的存储需求,并决定了使用哪种方法对不同的数据组进行分层以实现最佳性能和利润后,接下来的任务就是如何让数据在各层之间自动传输的问题了。下图来自SNIA(全球网络存储工业协会)数据管理论坛,它对数据如何在不同层间流动给出了一个初步的想法,但很显然,数据流的控制应该是自动化的。 因为这样的管理极其繁琐,所以除了那些非常小的公司之外,如果其他公司想用人工管理是很不现实的。
存储分层是信息生命周期管理(ILM)实践中的一个分支。而分层式存储则指如何排列数据,ILM是说明了信息如何从最初生成发展到最终处置的一组操作和规定。SNIA对ILM的具体定义是:“信息生命周期管理包括策略,处理,实践和工具,最终处置信息的过程中会得到一些数据,信息生命周期管理能将这些数据的商业价值和最适合的价格最优惠的IT系统结合起来。把管理政策、服务质量和应用程序、元数据、信息及数据联系起来,在此基础上,实现信息和业务流程的完美联合。”
有一种简化理解ILM的方法——将重心放在日期和频率上。“ “飞机在X点起飞后,将该记录从Tier 0 移动到Tier 1,” 或者“如果某项数据每周的访问次数低于X次,就将它从Tier 1 移动到Tier 2”。有时,这就是一个完整的分层存储技术实现稳固投资回报率(ROI)时需要做的全部工作。戴尔公司谈论它的Compellent Fluid Data产品时指出,按照下面的原则,可以优化数据迁移:
减少驱动器数量和降低供电/冷却成本的时候避免使用手动数据分级和迁移。
如果Tier 1存储器中有经过性能优化的RAID,如RAID 10,就把活跃的数据块写入该Tier 1存储器
把不活跃的数据块自动移动到较低级的存储器中,且该存储器中要有保护功能强大的更贵的RAID 5或6
将SSD, FC, SAS和 SATA驱动器混在同一个系统中使用,而且同一个磁盘柜里SAS驱动器要有多种转速。
优化写入性能和数据读取能力,以应对SSD中的关键应用程序
为任何一层增加容量的时候以及接到请求需要自动重新分布数据的时候不出现停机或系统崩溃
正如戴尔在下图中所示,数据不会总是从热移动到冷,注意到这一点很重要。很多情况下,数据可能需要从慢存储层迁移到快存储层,这也是为什么存储架构必须要可靠和高效的部分原因所在。
进一步调查研究ILM是很有必要的,因为如果没有合适的ILM,也就是说它没有得到你的IT团队和管理层认可的话,就不会实现存储投资的最佳回报,你的数据也可能存在更大的风险。
企业存储的重要性不只是ILM。随着虚拟系统——从存储器到服务器到云再到客户端——在复杂性和普及度上的持续增长,分层也开始逐步应用于这些领域。分层化存储在业界普及的这一天肯定很快就会到来,如果现在还没有的话。这也是为什么在构建分层存储系统时,每一层都要用最好的驱动器会那么重要了。找到你的企业需要的存储层,拟定一个高效可扩展的数据移动技术方案,并在这些存储层中使用正确的驱动器,这样就能形成稳定投资回报率了。