数据存储产业服务平台

2010年文件存储趋势:非结构化数据当道

综述

毫无疑问,2009年是IT界近年来最艰难的一年之一,它给科技厂商和IT终端用户的预算计划带来了深远的影响。虽然2010年预算压力不会继续增大,但是ESG的2010年IT开支意向调查[1]还是发现IT组织中普遍存在谨慎乐观的情绪:大多数组织已经从成本节约模式中走出,但是有可能继续控制成本而不是采用增长模式。这可能会导致用户继续寻找可以减少存储架构复杂性以节约营运成本的方式。ESG认为非结构化数据的增长、向外扩展和统一存储平台的日益成熟以及作为存储替代的云存储的崛起将促使用户开始解决非结构化数据存储的问题,并将他们的环境转型为更加具有效率的服务导向的架构。

2010年值得关注的文件存储趋势

1. 数据中心对基于商品的向外扩展平台的兴趣在持续。受经济疲软的长期余震影响,用户和厂商都在追求这种解决方案。从用户这一方面来说,ESG在2008年底/2009年初的研究表明用户对向外扩展NAS(网络附加存储)解决方案有很大兴趣。这种解决方案有良好的可扩展性、商业敏捷性和操作上的高效率[2]。2009年IT开支放慢到接近停止增长,因此许多客户对向外扩展平台仍然还只是停留在兴趣阶段。2010年,ESG预计这种兴趣将转为实际的开支。一些大厂商(比如EMC、日立数据系统、惠普和IBM、NetApp)继续投资于向外扩展产品并认证针对企业应用的基于商品的向外扩展架构。

2. 垂直整合堆栈和水平的基于服务的方法这两个不同的方式将加快发展。垂直整合堆栈包括惠普的X9720–这个系统整合了惠普的IBRIX Fusion软件、刀片服务器和StorageWorks阵列–IBM SONAS、NetApp 7G系列、ISilon的X、S和NL系列产品。水平的基于服务的方法包括采用商品硬件的Bycast StorageGrid和EMC Atmos。当然,每种方法都各有利弊:整合系统通常部署更快且更易于管理,每TB数据所要求的存储或系统管理员比例也比较低。但是这些解决方案是专用的,从存储阵列到NAS设备到文件系统各方面会导致厂商锁定。水平的分层的方法让用户可以在每个层上选择最好的技术,而且可以灵活部署。水平方式的缺点是它们的安装和管理往往更复杂–需要更高水平的专业服务支持来处理和部署这种解决方案–而且比起整合系统来说,每TB数据所要求的存储或系统管理员比例更高。

3. 统一存储在二层以上应用中代替专门的SAN(存储局域网)和NAS。全球经济疲软导致用户继续缩减营运开支。用户总是需要针对不同应用部署新的专门存储系统,因此越来越多的用户面临存储"复杂性疲劳症"。通过统一存储,用户可把存储当作一个灵活的池来进行规划和管理并支持基于块的和基于文件的数据,不需要规划和管理各个单独的基于块和文件的存储环境。随需部署资源的灵活性可以帮助提高利用率,因为这样存储容量就不会被锁定在错误的存储类型,同时减少需要部署的系统的数量。

4. 作为虚拟服务器和虚拟桌面环境的后端,统一存储继续发展。封装的虚拟服务器和虚拟桌面镜像毕竟只是文件。自从虚拟化浪潮开始以来,用户就一直在同文件后端打交道。NetApp、VMware和思科这样的厂商联盟将加速这股浪潮。也就是说,ESG预计企业用户将在第一层应用中出于性能缘故而采用基于块的裸设备镜像(RDM),而小型IT组织和第二层应用将采用完全封装的VM,即包含了操作系统、应用程序镜像和数据并可以使用NAS后端的VM。无论是何种方式,统一存储都给了用户一个灵活存储虚拟机数据的方式。通过统一存储,用户无需再预测和购买不同的单独的SAN和NAS容量。

5. "绿色"重新成为潮流。尽管许多组织通过部署更高能效的架构可以明显减少营运成本,到2008年年底,"绿色"已经成为一种时尚词汇,这意味着一旦全球经济恢复增长,IT用户和厂商会倾向于"绿色"的解决方案。2010年,用户将从战术上走出成本节约模式并将寻找可以减少环境影响的IT解决方案(这种方案同时也有助于减少营运成本)。采用高容量磁盘驱动器的更有效的密集的存储系统将加快发展,帮助用户减少数据中心空间占用和能源/冷却成本。

6. 基于政策的存储管理获得更多关注。由于EMC在全自动存储分层(FAST)上的重大发布,自动存储分层在2009年获得了许多关注。ESG预计2010年NAS厂商在这个领域上将有更多动作。分层和信息生命周期管理面临的一大障碍仍然是如何更好地对数据进行分类以便决定其合适的存储层。这项工作不能在存储阵列内部完成。阵列是根据访问类型来迁移数据。通过文件元数据,我们可以在文件系统管理层上分类非结构化数据。

7. 对象存储继续仍然引人注目,但是发展没那么快。Panasas和EMC(拥有Atmos和Centera)等厂商提供基于对象的存储。基于对象的系统在大小不等的"封装器"中同时承载数据和元数据。对象能带来一些明显的优点:例如,可以加入增强后的元数据并同提供增强管理功能的对象打包在一起。Panasas可以将文件分解成多个关联的对象并将其条带化在多个节点中,同时使用并行通道来增强性能。不过,对象存储的问题和垂直整合系统的问题一样:厂商锁定。一旦用户部署基于对象的存储系统,只要数据存在,用户就必须从这个厂商购买产品和服务。替代方式将是痛苦而漫长的迁移。对于一些用户而言,对象存储系统的使用方便性、可扩展性和整体效率使得它们值得投资。受益于这些优点,EMC发售了许多Centera系统。Panasas看到许多用户也非常需要它的并行架构所带来的大吞吐量。尽管基于对象的存储有许多潜在优点,但是像NFS(网络文件系统)和CIFS(通用互联网文件系统)这样的替代方案已经有人采用,而且这些方案还是基于标准的和易于理解的–受验证过的和可靠的技术比较能够让IT人员省心。虽然迁移到基于对象的系统能带来许多优点,但是如果考虑到锁定风险的话有可能是不值得的。

8. 非结构化数据推动公共云的发展。连接云存储"层"的本地网关将被越来越多的用户用于提高非关键数据的站内容量。用户仍然担心许多数据的合规问题和安全问题,但是仍然有许多数据不需要锁闭和审计,尤其是在那些没有严格监管的行业,因此这种非关键数据非常适合于云存储。教育业就是一个很好的例子:大学可以方便地利用云存储服务来管理学生主目录。你可以想象一下这对一个拥有上万学生的大学来说将是多大的成本节约。非关键数据的长期归档也是云存储的适合用途之一。像Iron Mountain Digital这样的提供基于政策的归档保护和管理的云归档厂商将获得更多的业务。

9. 2010年厂商之间的兼并重组将继续进行。我们看到2009年惠普收购了IBRIX,LSI收购了OnStor。一些小型的NAS厂商仍然挣扎于2009年低迷的用户开支环境中,而投资者仍然捂紧口袋。我们看到2009年的一个趋势就是用户减少了他们打交道的厂商数量以降低成本。当然,这些用户一般不会踢开主要的IT提供商–不过这个现象对小型IT企业可不是好消息。市场传言戴尔正在寻找一些NAS厂商来增强其基于Windows的产品,戴尔也确认该公司已经收购了向外扩展NAS厂商Exanet的资产。日立数据系统和IBM的NAS业务都很大程度上依赖于OEM(贴牌厂商)关系,因此这两家大公司如果有什么动作的话,那也不用奇怪。

整体趋势

2010年,非结构化和基于文件的数据将继续迅速增加,而IT人员将继续要处理这个令人头疼的问题。现在,2008年底以来的预算约束已经稍微放松,用户正在走出成本节约和预算削减模式并寻求各种解决方案来实现长期营运成本节约。

更有效地管理数据增长是首席信息官比较容易实现的目标之一,它可以节约IT成本和时间。过去15年来,数据中心主流的NAS架构实际上没有多少改变。这些系统的设计是针对分布式计算环境,往往只能扩展到数百个磁盘驱动器。如今PB级环境已经在突破向上扩展系统的极限,导致存储系统性能下降并带来更复杂的存储环境。除了成本增加外,这种复杂性还带来了风险:复杂的环境和针对复杂环境而设计的人工流程会抵消数据安全措施的有效性。如果没有非常大的工作表,在这种环境下很难确定哪些数据存储在哪些存储系统中–而如果依赖于这种程度的人工操作,那么人工错误发生的几率也将增加,导致关键数据有可能在某些时候失去保护。

许多IT管理员对变化是谨慎而抗拒的,这就是为什么IT上的变化通常要花很长时间,尤其是在存储领域。但是我们不要搞错:我们还是会看到数据存储方式上的变化。IT人员的谨慎可以理解,无论现状多么糟糕,他们都不想因为重大架构修改搞砸而面临公司高层的训斥。不过,凡事都有一个临界点。大型用户往往在电力和冷却资源的可用性上面临约束,而中型企业往往在空间上面临限制。复杂性以及与之相关的营运成本必须得到控制。现在已经有早期迹象表明2010年企业领域的存储革新将加快脚步。当然,第一层应用有可能还是采用专用的向上扩展的系统,但是对于第二层以上的应用而言,朝向新模式的改变才刚开始。


 [1]:来源:ESG研究报告《2010年IT支出意向调查》,2010年1月;

[2]:来源:ESG研究简报《向外扩展NAS的采用和市场推动力》,2009年2月

未经允许不得转载:存储在线-存储专业媒体 » 2010年文件存储趋势:非结构化数据当道