数据压缩、重复数据删除、自动精简配置、自动分层和存储虚拟化,这五大技术在过去三年是存储行业最为热门的存储技术,几乎所有的主流存储供应商都对这五项技术提供了相关的技术和产品支持,以戴尔为例,通过对EqualLogic、Compellent、Exanet和Ocarina等公司的收购,戴尔如今提供了全面的存储技术和产品——事实上,这些收购全部都目标明确——这些公司无一例外的在其中某个领域提供优势明显且面向未来的技术。
针对性的收购意味着对技术的针对性需求,而数据压缩、重复数据删除、自动精简配置、自动分层和存储虚拟化这几项技术之所以获得如此针对性的重视,源自于这几项技术被研发出来且快速进入市场得到普及的原因都是相同的:提高存储效率,实现高效的数据管理。
面对数据量的急剧膨胀,企业需要不断购置大量的存储设备来应对不断增长的存储需求。权威调查机构的研究表明,目前世界大公司的年度存储需求增长率为100%。然而,这似乎并不能从根本解决问题。首先,存储设备的采购成本越来越高,大多数企业难以承受如此巨大的开支。其次,随着数据中心的扩大,存储管理成本、占用空间、制冷能力、能耗等也都变得越来越严重,其中能耗尤为突出。在美国,数据中心大约消耗掉2%总电量,每年电费开销高达40亿美元。
Gartner曾预测,2009年全世界将会有一半以上的数据中心电力供应不足。Emerson的调研则显示2011年96%的数据中心将缺乏电力,美国许多企业的数据中心被迫迁至其它电力供应充足的地方。再者,大量的异构物理存储资源大大增加了存储管理的复杂性,容易造成存储资源浪费和利用效率不高。研究发现,企业的存储利用率往往不足50%,存储投资回报率水平也很低。
但高效存储并不是靠数据压缩、重复数据删除、自动精简配置、自动分层和存储虚拟化这几项技术中的一项或某几项便能够成功的,企业需要合理整合这五项技术,才能够显著地提高存储利用效率、降低能耗及降低成本,而与此同时,这五项技术的产品载体——如DELL Compellent、EqualLogic等产品线——需要良好的互操作性和产品线的整合。
因此,戴尔提出了流动数据管理解决方案,将Compellent、EqualLogic、PowerVault及DX对象存储平台实现了前所未有的整合,从而得到了高效的存储管理架构。
高效存储多管齐下:五项技术各有侧重
正如上文所说,高效存储需要多管齐下,而不能仅仅依靠一两项技术实现——由于数据的流动和特性——不同的技术满足了高效存储的不同诉求和需要解决的现实问题。
数据压缩、重复数据删除基于对需要存储的数据在容量/体积上的缩减,将需要保存的数据量降低到最低限度,减少了所需要的存储容量,提高了单位存储容量空间所能够承载的数据。这不仅节省了大量的硬件开支——更少的存储设备和网络传输带宽——也节省了需要这些数据时所需要耗费的时间。
自动精简配置则彻底消除了未使用的预配置空间所造成的存储资源浪费。物理存储空间的消耗只和实际写入的数据相关,这不仅简化了配置过程,还提高了存储容量利用率。自动分层技术则将经常被访问的数据自动迁移到高性能的固态硬盘中,同时将长期不被使用的数据自动迁移到大容量、低成本的NL-SAS或SATA磁盘中——通过按照数据的访问频度(热度)和失效来判断数据的“归宿”——自动分层极大的减少了主存储系统的负担,将主存储系统昂贵的高性能磁盘从单纯的“存储”功能中解脱出来,而专为“高性能”需求所用。存储系统的效率自然获得了极大的提升。
存储虚拟化在这几项技术中的历史仅仅短于数据压缩。存储虚拟化将系统与存储资源池化,形成可以共享的资源池——存储虚拟化是一种贯穿于整个IT环境、用于简化本来可能会相对复杂的底层基础架构的技术——存储虚拟化的思想是将资源的逻辑映像与物理存储分开,从而为系统和管理员提供一幅简化、无缝的资源虚拟视图。
对于用户来说,虚拟化的存储资源就像是一个巨大的“存储池”,用户不会看到具体的磁盘、磁带,也不必关心自己的数据经过哪一条路径通往哪一个具体的存储设备。从管理的角度来看,虚拟存储池是采取集中化的管理,并根据具体的需求把存储资源动态地分配给各个应用。
将存储资源虚拟成一个“存储池”,这样做的好处是把许多零散的存储资源整合起来,从而提高整体利用率,同时降低系统管理成本。与存储虚拟化配套的资源分配功能具有资源分割和分配能力,可以依据“服务水平协议(SLA:service level agreement)”的要求对整合起来的存储池进行划分,以最高的效率、最低的成本来满足各类不同应用在性能和容量等方面的需求。特别是虚拟磁带库,对于提升备份、恢复和归档等应用服务水平起到了非常显著的作用,极大地节省了企业的时间和金钱。
Compellent:高效存储的集中体现
作为戴尔存储产品线中的重要组成部分,Compellent通过一系列的领先技术,实现了在主存储系统的高效存储,降低了主存储的系统的总拥有成本,而基于Compellent自创立之初即奉行的跨代兼容战略,Compellent提供了极好的资产保护。
Compellent存储系统的主要特点和功能:
绿色节能
自动分层(Compellent 命名为“数据分级管理”)能够根据数据类型和数据的灵活性需求,选择最适合的存储类型,从而优化PCSE(功耗、冷却和空间利用率),降低数据的生命周期管理成本。
此外,Compellent 通过“快道技术”、“自动调优”,让最活跃的数据位于磁盘外部区域,无需追加成本即可进一步优化性能,提高磁盘利用率,减少所需的磁盘数量。其“精简复制”技术通过快照和只复制变更的数据块,减少了带宽需求。
容量/利用率优化
自动精简配置(Compellent 命名为“动态容量”)彻底消除了未使用的预配置空间所造成的存储资源浪费。物理存储空间的消耗只和实际写入的数据相关,这不仅简化了配置过程,还提高了存储容量利用率。
“数据即时回放”(Compellent 的快照技术):使用指针进行细粒度的快照,且只有在数据块被写入时才会真正消耗物理存储空间。
“闲置Windows空间再利用”技术:通常,Windows文件从配置的SAN卷中删除后,闲置空间对于操作系统仍不可以再使用。Compellent的闲置Windows 空间再利用技术,在这些Windows文件删除后,闲置空间能够得到有效地再利用,从而提高了资源利用率。
操作管理的简易性
一次性软件授权许可简化了采购成本和持续管理成本的控制过程。
简单的GUI和全面的管理功能最大限度地减少培训,并让管理变得简单高效。如一次按键的自动恢复功能,不到一分钟完成存储卷创建,几秒钟完成任意卷恢复。
基于策略的自动化/ 虚拟化简化了管理且无需性能调优。
“精简导入”功能实现了数据从第三方陈旧设备导入到Compellent 产品过程中的精简,提高了空间使用效率。对于用户来说,设备使用效率越高,所需拥有的设备和配套设施也就越少,节省的空间和耗能就越多。
优化跨数据中心数据的高可用性
Compellent 的Live Volume 作为存储管理器可以将一个存储卷映射到不在同一数据中心的两个Compellent阵列上,让用户能优化跨数据中心资源的利用率,提高跨数据中心的数据高可用性和连续性。
这种跨数据中心高可用性提高了虚拟数据中心和“云”部署的存储资源使用率和数据的高可用性。
统一存储:实现数据管理新体验
统一存储的概念来自于将块存储和文件存储整合为一个系统的需求,其提供块数据(FC、iSCSI SAN)及文件数据(NFS、CIFS协议)的同时访问,将原有孤立、分割的块存储和文件存储统一到一个存储系统以及存储管理平台上。不过,需要说明的是,目前主流的统一存储系统并不是采用单一控制器——2011年主要的统一存储系统基于将SAN架构和NAS设备的整合——当然,控制器的形式并不影响统一存储所提供的功能。
将SAN和NAS统一在一个存储体系中的最大优势包括两点:一是对存储容量的充分利用(绝大部分都是SAN存储系统加NAS机头,容量来自于SAN),同时减少支持块和文件存储所需要的硬件,资源在物理层就已经实现了基于硬件的池化;二是企业在统一存储在管理上的巨大获益,存储容量、性能和资源管理能够实现统一规划,以及为各项存储管理工作提供了统一的管理界面。统一存储提高了在SAN和NAS混合环境下的存储效率,减少了管理的成本和时间,作为在系统层面的整合与技术实现,统一存储为高效存储提供了基础。
但往往统一存储并不作为单独的存储系统来销售——正如前面所说的主流的第二种方式所展现的——统一存储的组成来自于SAN存储系统和NAS网关(机头),这也就意味着存储供应商基本上是基于已经成功的SAN存储系统来增加与NAS网关的统一存储功能。
统一存储的成功也就由此决定于两点:1、SAN存储系统和NAS机头的性能、功能;2、统一化的管理平台。
以戴尔前不久推出的Dell EqualLogic FS7500为例,其主要是基于EqualLogic iSCSI存储系统增加3台1U的设备——两台1U的双路至强服务器实现Active/Active(双活)NAS网关加上1台保护内存掉电时数据不会丢失的UPS设备——可以用于EqualLogic PS系列SAN实现统一存储,支持系统最大容量509TB的单一命名空间。
EqualLogic的SAN存储系统当然不用赘述,PS6100、PS4100、PS65x0、PS60x0和PS40x0系列SAN在中国市场取得了不错的反响,其性能与容量的线性扩展、简单自动化的存储容量分配、面向虚拟化的软件自动化功能,使得EqualLogic成为优秀的iSCSI SAN存储系统,为戴尔的统一存储提供了坚实的SAN平台。
戴尔同时提供EqualLogic的组管理器(Group Manager)存储管理软件,为用户提供了针对块级数据和文件级数据的统一界面,支持iSCSI、CIFS和NFS协议数据的统一访问。
不过,戴尔推出EqualLogic FS7500的关键点在于“FluidFS文件系统”——戴尔可扩展的流动文件系统:来自戴尔收购的Exanet,支持性能的横向扩展和容量的纵向扩展,将存储池作为具有单一虚拟IP地址的单一文件系统提供给存储客户端。提供单个全局命名空间,以提供灵活的可访问性。
虽然目前FS7500暂时支持4节点,且FluidFS的存储容量最大支持509TB,但随着未来戴尔可能将其升级到更多节点,FS系列将实现极大的存储容量和高性能的统一存储系统,这也就意味着,戴尔将能够提供大容量、高性能的统一存储系统,实现SAN与NAS的大规模的整合管理和高效利用。
流动数据的概念在EqualLogic FS7500上获得了新的延伸:在一体化的统一存储系统中实现更为顺畅的数据流动,不仅仅是将数据从高速磁盘流通到低速大容量磁盘,更在一个统一管理的系统中,将块数据和文件数据的流动有机的整合在一起,按照数据的生命周期统一的流动数据,而不是将块数据和文件数据分别处理。
戴尔DX6000G已经引入了一部分压缩功能,在不远的未来,戴尔还将有可能将来自于Ocarina的数据压缩、重复数据删除技术引入数据备份以及统一存储系统,从而实现更为高效的统一存储及数据保护——无论是块存储、数据保护、归档、还是文件存储——统一的高效管理和高效的统一存储系统,让数据流动的更畅通,让数据管理的更智能。