DOSTOR存储在线 6月18日原创报道:
HDS总会带给你与众不同的产品。
作为存储行业的重要供应商,HDS(日立数据系统)的技术、产品发展方向,看起来总是朝着自己所规划好的方向发展,可以说,这是一家“最为坚持自身发展方向”的存储供应商。4年前,HDS发布当时唯一支持SAS的中端存储系统AMS2000——无论是从强大的双控双活能力,还是从当时在中端存储系统中对SAS技术的唯一支持——AMS2000都不能够被称为一款“普通产品”。
随后几年,AMS2000一直是HDS的中流砥柱,事实上,业界也一直在观察和期待HDS到底会在何时推出下一代中端存储系统。在等待AMS2000继任者的几年里,我们见到HDS推出了USP V的接替者VSP,推出了HCP日立内容平台,提出了信息云、内容云,收购了BlueArc公司——但就是没有AMS2000接替者的消息。
与此同时,HDS的竞争者们,不仅在对SAS的支持上追赶上了HDS,更在6Gb/s SAS上实现了反超。而更重要的是,EMC、IBM、NetApp、惠普甚至是戴尔,或通过收购或通过产品线升级,更新了中端存储系统产品线——不仅仅是SAS,而是“块+文件”的统一存储系统,一时间,你几乎找不到一款在更新时不提到“统一存储能力”的中端存储系统产品。
所有人都在期待,这一次,HDS能够“玩出什么花样”?
HDS的答案是:HUS(Hitachi Unified Storage)是一款将文件、块、对象存储整合在一起的统一存储,而不仅仅是文件与块数据的统一。我们尚且将HUS如何实现对象文件存储整合到块与文件的统一存储系统中,仅就在支持对象文件存储这件事情上,HUS让HDS在中端存储系统上实现了反超越。
对此,HDS官方是这样表述的:“(HUS)是无需妥协的统一,Hitachi Unified Storage 可以在数据的整个生命周期中持续并高效地对其进行配置、分层、迁移和保护,而无需顾虑数据类型。”
但这并非是HUS试图实现反超越的唯一法宝。
HUS所代表的HDS整体全线中端存储产品家族
随着HUS的上市,Hitachi Command Suite 管理软件也进行了更新。新版本的Hitachi Command Suite 管理软件将能够管理包括HUS在内的HDS“所有硬件产品组合”,这意味着,不仅包括HUS、HCP或是HDS的NAS平台,其高端的VSP存储系统也能够被Hitachi Command Suite所管理。
这显然是得益于HDS一直坚持自己的产品研发体系中推出新的产品而不是通过不断的收购来扩充产品线——虽然这也让HUS的发布时间有所延迟——HDS将会是主流存储系统供应商中,“第一个向企业级客户提供单一软件管理平台的厂商”。
Hitachi Command Suite所能做到的事情极大的提高了HUS的竞争力。试想,在一个应用高端存储系统的用户中,中端存储系统的物理设备数量显然会多于高端系统,而如果能够将中端、高端存储系统统一实现物理设备的管理,这至少在物理设备的管理层面减少了一半的窗口和视图。这对于原有VSP或是USP V的用户来说,显然将增加他们采购HUS的吸引力。
但是HUS到底是一款什么样的系统?所谓的“三位一体”,到底能够为用户带来哪些好处?HUS作为AMS2000的替代产品,又在哪些方面胜过自己的前任?对此,我们采访了HDS公司中国区解决方案与专业服务事业部总监陈戈。
HUS“三合一”:何为对象存储?
虽然HUS走在了中端存储——统一存储——的前列,但是,在文件+块整合的统一存储市场,HDS将对象存储整合入HUS,仍然是一件令业界颇感意外的事情。在此之前,我们更多的使用对象存储系统——往往被称为CAS存储系统——用来做归档的工作。
不过,在谈到两个核心问题:HUS如何实现对象存储,以及HUS的统一存储能力要加上对象存储之前,我们首先要看看到底什么是对象存储。
对象存储系统(Object-Based Storage System)顾名思义,是以“对象(Object)”为存储单元的存储系统,区别于SAN存储的“块”和NAS存储的“文件”,“对象”包含了文件数据以及相关的属性信息,可以进行自我管理,每个Object是数据和数据属性集的综合体。数据属性可以根据应用的需求进行设置,包括数据分布、服务质量等。
在传统的存储中,块设备要记录每个存储数据块在设备上的位置。Object维护自己的属性,从而简化了存储系统的管理任务,增加了灵活性。Object的大小可以不同,可以包含整个数据结构,如文件、数据库表项等。
对象存储系统最大的好处,就是能够非常容易地共享数据,综合了NAS和SAN的优点,同时具有SAN的高速直接访问和NAS的数据共享等优势,提供了高可靠性、跨平台性以及安全的数据共享的存储体系结构。必须要说明的是,一个完整的对象存储系统,需要包括对象(Object,也就是存储的对象)、智能设备OSD(Object-based Storage Device)、文件系统(对象存储最终还是要基于文件系统的)以及一个存储了元数据的元数据服务器(Metadata Server,MDS)。
正是基于对象存储的好处——更加“丰富”的数据信息及其所带来的检索数据的简便性,对象存储更多的时候是被用来作归档的,在加入了WORM(一次写多次读)技术之后,在2005-2008年前后,业界涌现出了大量的以对象存储技术为基础的归档存储系统。而在2007-2009年,我们也看到了部分初创厂商,开始尝试将对象存储系统推广到在线存储系统上,但是,由于成本和存储架构的原因,当时的推广效果并不好。
不过,随着时间的推移,对象存储的重要性与日俱增。从2008年开始,无论是非结构化数据的激增,还是大数据的爆炸,所有存储行业趋势或难题的矛头,都指向文件型数据,这为对象存储创造了第一个发展良机——文件存储在很大程度上是对象存储的基础,而第二个两级,来自于大数据时代对数据分析的要求,对象存储系统在共享数据、丰富数据信息等方面显然更有优势。
但这是否意味着对象存储系统将焕发第二春?HUS中的对象存储到底将发挥什么样的作用?这还需要陈戈来解读。
陈戈:对象存储是“可选的能力”也是“新的基础”
陈戈认为,在HUS中增加对象存储的选项,既是为HUS增加“可选的、与众不同的能力”,也是未来应对大数据分析的“新的基础”。
“也就是说,HUS提供一种补充,你不但可以存储块数据,也可以存储文件数据,而且,HUS还提供给你一个升级选项,你可以使用HCP网关来存储对象数据。我不敢说会有大量的客户有这种需求,但是可能会有一部分用户会说:‘我有数据库,有文件数据,要统一的存储,我还有一些图片或是其它文件需要归档或是使用对象存储来保存。’HUS给了用户这样一个可以共享的模式。”陈戈表示,HUS增加对象存储的第一初衷,就是提供给用户一个“可选的能力”,或者说“多样的选择”。
陈戈认为,无论是用户有特殊的对象存储的需求——Object确实有更优异的地方——还是用户打算在HUS所代表的中端存储中基于对象存储基于归档,这都是HDS提供给用户的一种能力,从这个角度来说,HDS更倾向于认为要区别备份和归档的作用,归档不是长期的备份,而是一种面向数据分析和离线调用的数据存储模式。
“对于企业来说,会有这样的很多中小企业客户,各方面的需求都不是那么强烈,对数据库、文件的访问,只消耗了一部分的性能,但是却又有一些归档的需求,而采用HUS这样的解决方案,当然也就是说省出了一个归档的系统。”陈戈认为,至少从HUS的角度为用户提供一个功能是无可厚非的,这毕竟是一种可选项,而且是“独一无二的可选项”。
而谈到为何以对象存储统一归档的需求,陈戈认为,归档面向的是数据的分析,而不仅仅是法规,这也就意味着,不可能“割裂的进行分析”,不能说“在线的数据与归档的数据分开进行分析”,从这个角度来说,在一个系统或者说在HUS统一存储中,显然数据分析会更加简单一些。
不过,在HUS中加入对象存储显然不仅仅是为了面向如此小众的“统一归档存储需求”,归档市场过去、现在都不是HDS的强项或是重要的利润点——即便现在有HCP或是其他HDS的归档解决方案,HUS的对象存储能力,理应还应该有更重要的作用。
陈戈在这个问题上只是点到为止,而且仍然以归档为基础,但是也仍然联系到了我们不得不想到的“大数据的话题”。他表示,之所以现在业界认为大数据的存储、管理和分析存在挑战,关键是“现在的大数据解决方案,在技术、产品方面其实不成熟”,所以用户要面对“五年后数据如何融合、如何输出的问题”。
他认为,HUS的归档提供一个长期的内容池,将用户的数据,放在一个统一的、池化的对象存储中,为每一个数据增加Metadata,增加丰富的“对象信息”,“这样的话,你将来要做BIGDATA的时候,起码很容易找到这个DATA是什么,是什么。因为通过你的一些USER Meta DATA,这样的话,才能够很方便地让人真正迈向所谓的BIGDATA。”
这也就是说,如果用户还没有做好面向大数据,尤其是大文件、大数据分析的存储基础,或是不满足于现在的大数据分析平台,HUS提供一个“冷冻数据”的方案——类似于科幻小说中将人冷冻起来以寻求未来科技的帮助——形成具有丰富对象数据的对象存储池,以备在未来几年寻找到更好的进行大数据分析的可能性。
但从业界的角度来看,对象存储融合文件存储系统或许是一种未来的趋势,毕竟对象存储与文件存储是同宗同族的关系,两者之间的关系本来就非常的紧密。
对象存储厂商Caringo的首席执行官马克格鲁斯(Mark Goros)认为,对象存储可以完成文件系统存储所无法完成的工作。它可以用来储存大量非结构化数据,对象存储与文件系统存储的另一个关键区别在于对象存储系统具备无限的可扩展性,而且用户不需要建立复杂的用户群组、目录结构,而且提供更为丰富的文件信息——这都是现在的文件存储系统无法提供的。
而且从目前云存储的发展情况来看,对象存储看起来更受到云存储供应商和服务商的青睐。作为对象存储最早的“云实践”,Atmos现在的销售情况良好,而作为开源云计算的重要平台,OpenStack平台的存储功能实现就是通过被称为Swift的对象存储平台——虽然Swift还有许多的限制和不足——但至少它证明了对象存储与云计算的紧密关系。
对象存储的实践与HCP的重要地位
HUS如何实现对象存储?HUS中对象存储的灵活性、可用性与扩展性,是否如同其他独立的对象存储一样?HUS的对象存储的优势又在哪里?这些,都是HUS不可回避的问题。
仔细品读新闻稿中的这段话,或许我们能够发现一些端倪,官方新闻中是这样叙述的:“Hitachi Unified Storage 通过一个独特的基于对象的文件系统来支持对象数据,该系统可以智能地为每个文件增加元数据并实现自动分层、迁移、对数据快照和复制、在广域网中更快复制以及快速数据搜索。此外,Hitachi Unified Storage 支持Hitachi Content Platform(HCP) 利用定制的元数据来存储真实对象并提供法规遵从功能。与替代系统的方式不同,HCP可以利用在同一个存储池中的文件和模块应用分享HUS的容量。两者相结合,对于客户来说,这个解决方案比独立的筒仓对象存储设施更加节省空间和成本。”
首先,我们可以肯定的是,如果HDS的宣传资料无误的话,HUS的对象存储支持自动分层、数据快照、复制,并且提供了法规遵从能力——或许是WORM技术;其次,显然HCP与HUS的关系非常紧密,而“这个解决方案比独立的筒仓对象存储设施更加节省空间和成本”这句话显然说明,HUS的对象存储系统想要发挥其最大价值,HCP是必不可少的。
HUS统一存储架构中,HNAS系统3080、3090和3200平台能够明显看出是基于原有的BlueArc平台的——这也是HDS近几年在住存储系统上不多的收购之一——BlueArc的文件系统被称为SiliconFS,HNAS的文件存储系统显然是以SiliconFS为基础的。值得注意的是,很早以前SiliconFS就被称为是“能够提供更好性能和可扩展性的以对象为基础的文件系统”。
因此,如果仅从“存储”的角度来看,HUS的对象存储是利用BlueArc的以SiliconFS文件系统为基础的文件平台实现的(文件存储当然是通过CIFS/NFS 实现)。BlueArc的SiliconFS系统也就起到了对象存储系统中底层文件系统的作用,当然,文件系统是建立在OSD设备上的,这也就容易理解HNAS的作用。用一句比较拗口的话来说,HNAS系统提供了一套对象组织的规则实现系统存储的对象的管理。
但从HCP上来看,顾名思义,HCP是Hitachi Content Platform,即日立内容平台。我们之前说过,对象存储系统并不仅仅是“文件存储系统的+元数据”的简单组成,其需要实现文件与目录的对应关系、对象与OSD的对应关系,以及一个“仓库式”的管理方式。这也就是Hitachi Content Platform(HCP) 所做的——利用定制的元数据来存储真实对象,为数据管理和长期保存提供对象存储仓库。
这也就是说,如果只是将文件以“对象”的方式存储,HNAS就可以实现,也就是HNAS主要做的事情——提供添加了数据管理智能化的基于对象的文件系统,而如果需要更加高级的功能——如更多的对象数目支持或是实现一个对象存储仓库——当然就需要HCP出马了。
HCP是过去两年HDS力推的产品,我们甚至都可以揣测,HUS增加对象存储的能力,一方面是基于BlueArc本身的SiliconFS的优势,另一方面,就是基于推动HCP的发展,为HCP奠定良好基础为目标。作为一个基于内容的存储解决方案,HCP曾经是HDS非常重视的以内容为基础的归档平台,但随着HDS的云计算战略转变为以内容、信息和知识化转变为重要方向,HCP内容管理存储平台的身份就变得异常重要——可以说这是HDS内容云乃至整个云的基础——而HCP显然必须依赖于一个能够很好地支持内容提取的存储平台,对象存储当然是首选,所以,HUS实现对象存储的统一化,以及HCP为HUS的对象存储提供高级别能力,都是意料之中的事情。
也正是因为对象存储系统的加入,才让HDS将HUS(或者我们可以称其为新一代的AMS2000中端存储系统)和HCP紧密的结合在了一起。如果说HDS的HUS统一存储表面上的优势来自于对象存储的话,其更深层次的优势,实际上来自于“HUS+HCP”——即数据(块、对象、文件)存储与内容管理平台——的紧密集成,也让传统的中端存储从数据存储的层面,进入到了内容管理乃至非机构化数据管理与分析的层面。
或许当初只是为了实现HCP的整合,或许是为了推广HCP的销售,HUS与HCP的结合,实际上是HUS区别于其他存储供应商的中端统一存储系统的重要特征。不过,这还是2、3年后的事情,就像是陈戈说的,大数据的解决方案还未成熟,HUS+HCP也只是提供了一个“冷冻”技术,无论是技术实现还是用户接受程度都有待提高,最重要的是,HUS能否真正有效的替代AMS2000这一HDS中端存储长期的基石?
搏杀中端存储市场 HUS有何胜算?
无论是HUS(HUS目前有三个型号,110、130和150),还是前一代的AMS2000,HDS都坚持以“ASIC为核心处理器,X86为管理或非核心功能处理器”的架构,该具有HDS专利的ASIC被称为DCTL处理器(Data Control Application Specific Integrated Circuit,数据控制应用专用集成电路),是AMS2000中的RAID控制器和缓存管理处理器,虽然不清楚HUS中DCTL比AMS2000的有何变化,但是陈戈表示,确实有性能和功能上的改进。
HUS 150和AMS2000系列最高端型号ASM2500性能比较
因为在架构层面没有太多变化,AMS2000时代,HDS最引以为豪的“动态负载均衡双控双活”技术得到了完全的保留,基于“日立动态负载均衡控制器(Hitachi Dynamic Load Balancing Controller)技术”的新版本“日立动态虚拟控制器(Dynamic Virtual Controller)”技术,HUS仍然能够做到将每个LUN的工作负载平均分配到两个控制器上,从而实现真正的负载均衡与双控双活。
在HUS中,仍然能够云寻任何的主机端口访问任何一个控制器上的任何一个LUN,而无需改变LUN的所有权。当然,HUS仍然支持基于主机的操作系统路径管理,包括微软的Windows MPIIO、Solaris MPxIO、IBM AIX MPIO、Linux Device Mapper以及确保能够实现最小系统开销的Hitachi Dynamic Link Manager。
HUS 150控制器架构
Hitachi Cache Partition Manager则是HUS在中端存储上的另外一个优势。我们知道,几乎所有的存储系统都使用固定的块大小缓存算法(Cache Stripe Size),这虽然容易管理和能够简化算法,但是系统的缓存使用或是I/O操作性的效率并不是太高。在HUS中,Hitachi Cache Partition Manager可以针对具体的应用需求优化缓存大小,这能够在同样大小的缓存中提高访问命中率,并且通过优化磁盘读取的块的大小以获得更好的性能。
除此以外,HUS还包括256TB的单一命名空间文件系统以及Hitachi Dynamic Provisioning等功能。不过,坚持在中端存储系统上以ASIC为核心,仍然是HDS与其他行业内主流存储供应商最大的区别,在其他供应商都或多或少以X86架构为存储主流设计架构的时候,HDS仍然坚持在其专有的ASIC芯片上,加上HDS本身主要以自主研发为主,这也带来了HUS系统乃至整个HDS在线存储系统的一个特殊的价值。
那就是HDS可能是目前唯一在全系列产品,包括HUS的文件、块、对象存储,HDS的高端存储系统VSP上,实现统一管理的主流存储厂商。目前,Hitachi Command Suite 管理所有集成的日立数据系统产品组合,其中包括对模块(例如Hitachi Virtual Storage Platform),文件(Hitachi NAS Platform, Hitachi Unified Storage),内容(Hitachi Content Platform),以及特殊的设备(Hitachi Data Ingestor)的统一管理,以及HDS的VSP存储系统。
“作为HCS的套件,它可以做到设备管理、配置管理,然后是报警、性能的管理和监控,然后复制,HCS只做设备层面的技术方面的管理。”陈戈表示,HCS的管理是一个简化和整合的设备管理方式,虽然用户可以通过访问不同的设备,获得更多更深入的管理,但是从设备管理员、从整体管理的角度,HCS提供一个满足较少经验的管理员以及日常管理工作的统一平台。而这也是通过收购完善产品线所无法或者说是很难做到的事情。
而如果谈起对BlueArc的收购与整合,我们不难发现,由于HDS与BlueArc的长期合作关系,其整合更像是“部门与部门”的整合,这也是HDS在统一自身架构上的努力之一。
但我们不能否认,HUS所面临的对手十分强大,从EMC的VNX到IBM StorWize V7000,戴尔和NetApp也不甘示弱,惠普如今也充分的整合了3PAR的产品线——如果说高端存储系统仍然是HDS与IBM的天下,是两足鼎立——中端存储系统的市场更像是纷争的战国时代,甚至难以选出一个霸主。HUS固然有对象存储这个“人无我有”的功能,也有双控双活等等特色技术,但HUS面对的挑战仍然严峻。
陈戈表示,HUS在市场上将保持其自己的既定策略,那就是产品的销售“完全根据不同的需要来决定”——无论是块存储还是NAS模块,或是对象存储——HDS将会持续遵循“提供最大的灵活度产品”的产品线组成方式,与此同时,通过自身对存储应用的了解,提供给用户最优化搭配的建议。他认为,“最大客户灵活度+经验证的典型配置”的销售方式,能够让HUS在中端存储市场获得与AMS2000一样的成功。