数据存储产业服务平台

企业私有云存储产品巡礼:惠普3PAR一览

IT行业正在面临一个仿佛难以逾越的挑战,互联网以及移动互联网的兴起让我们无时无刻被数据信息海洋所“包围”,如目前的LBS服务,你的手机每发送一次GPS位置,还有你的互联网体验,每点击一次“分享”或者“顶”,你就给这个数字信息海洋“奉献”了一粒水滴。不仅如此,还有你的手机短信、客户记录、ATM交易、监控摄像……诸如此类的信息构成了我们现在的数据信息海洋。

上述这些服务让我们的生活更加便捷,但却给IT带来了前所未有的挑战。技术已经超出了我们的使用能力,也就是说我们没能跟上我们自己捕获信息的能力。企业或组织必须对这些数据加以分析并进行分类,以提取出或得出有价值的数据,但利用传统的IT设备(硬件和软件)显然无法胜任这一工作。云模式的兴起给IT 行业带来一线曙光,诸多组织开始将目光聚焦于这一新生事物之上,并给其加以诸多“光环”。

云是为了解决传统IT无法解决的新问题而诞生的,总的来说,其由三大部分构成,即计算单元、网络单元和存储单元。作为IT三大基础设施之一,存储当然也就面临着前所未有的挑战,海量数据的频繁流通给网络交互带来巨大压力,磁盘本身的瓶颈难以提供IT所需的性能,传统数据保护方式在海量数据环境下力有不逮,并且,传统IT在响应企业快速灵活部署时也 “心有余而力不足”。这些都必须加以改变,历史的经验告诉我们,大乱的时代必然英雄倍出,在现有技术无法满足需求的时候,必然将涌现出许多新兴的技术。就存储行业而言,3PAR无疑是一颗冉冉升起的“新星”,这颗新星在刚刚发出光芒的时候,就被惠普以20亿美元的代价“招安”,成为惠普攻占云市场的中坚力量。

企业私有云存储产品巡礼:惠普3PAR一览

▲惠普3PAR存储系统

3PAR目前分为F、T、V三个系列,共6个型号,其中V系列是惠普收购3PAR之后发布的一个新的系列,其主要帮助惠普角逐更高端的用户市场。V 系列与F、T系列的架构基本一致,均采用控制系统与数据系统相分离的架构,控制系统采用X86芯片,数据系统则采用最新的第四代的64位ASIC芯片,最 多可扩展至16个ASIC数据芯片,与之对应的是8个X86控制芯片,最高可支持1920块驱动器,并在同一盘柜中支持SSD、FC与近线磁盘混插使用。

实际上,从上述硬件来看,如果满配的话,3PAR明显是一个庞然大物,其官方公布的最大容量亦可达到1600TB。在这之中,如果仅仅是硬件的“强 劲”还远远不够的,不然的话,也不会产生现在这种“人人自危”的局面,在这个“庞然大物”之中还需要诸多的功能,如动态负载均衡、自动分层存储、自动精简配置以及强健的数据保护等等,而这些几乎是高端存储与低端存储的最大区别。

一般而言,谈到高端存储,尤其是适合云的存储设备,由于厂商技术的不同,其存储架构及实现的方式也就有着一些区别,这反应在功能方面也略有侧重,这 也是解释了为何在诸多场合,很难看到与其他厂商存储进行性能比较的原因。而3PAR作为最早进军云存储领域的“排头兵”,那么其究竟有哪些特点让其与云环 境最契合呢?下面我们一起来分析一下。

惠普3PAR:灵活扩展的网格存储架构

惠普3PAR存储系统内部采用控制系统与数据系统相分离的架构设计。控制系统采用X86芯片,而数据系统则采用ASIC芯片来专门负责。控制系统解 决数据存放问题,即数据是从什么应用系统产生的,应该存放到哪个区域,以及怎么存放,这些采用X86芯片就能很好地解决这一问题。而数据系统则是着重与数 据存放本身,如怎样处理应用产生的数据,怎样进行精简配置,如何提高零检测以及如何提高使用效率等等。

惠普3PAR产品经理杨溢先生认为,根据数据其本身的特点,存储一个数据通常包括两个部分,一个是元数据,即表明数据产生的地方以及存放的地方,这部分有控制系统来执行;而另部分则是数据本身,这部分操作则有数据系统来执行。

惠普3PAR:灵活扩展的网格存储架构

传统存储架构与3PAR存储架构对比

与传统的高端存储相比,3PAR在架构有很大的不同。通常情况下,传统高端存储的主机端口、高速缓存与数据存储是相分离,如高速缓存通常集中在一个资源池中,数据存储则集中于另外一个资源池。而3PAR则利用混插在盘柜中的SSD、FC磁盘以及NL磁盘各自形成统一的资源池,在根据应用实际情况分配 相应的性能,并且随着应用的负载变化,其性能可随需调整。

3PAR 背板采用全网状的连接结构,每个控制器节点之间高速直连。因为是全网状的,所以基本上一个链路坏掉只影响直连的两个节点的通信,对其它节点无影响(拓扑图 如上图所示)。每个控制器节点内置一块硬盘,用于操作系统安装。根据惠普官方提供的资料显示,控制器节点最多可以扩展到8个,其最大可支持1920块驱动 器,最大容量可达1600 TB。

无以伦比的极致精简技术

对于现在的高端存储系统而言,自动精简技术依然不是什么新鲜的话题。但值得一提的是,3PAR是首个将自动精简配置技术引入存储阵列硬件中的供应 商,这项技术在随后几年,成为了硬件系统的"标准功能",在这一过程中,3PAR在自动精简配置领域一直处于领先地位,并围绕于此,开发了多项相关的专利 技术,如Thin Built In。而在3PAR V系列发布时,惠普又赋予3PAR自动精简配置功能更多的含义,如16k的“纳米级”数据回收功能等等。

对于任一内置 Thin Built In的 3PAR InServ 阵列而言,3PAR Thin Conversion(精简转换)软件可利用3PAR Gen3 ASIC 的零检测功能,来实现原有阵列中低效的"臃肿"卷向更高效、更高利用率的"精简"卷的转换。这种卷的"精简"可以使数据中心实现绿色 IT 目标、消除空间浪费并提高较小容量系统的利用率。由于阵列硬件内嵌了由繁到简的转换机制,因此容量卷转换能够以线速联线进行,同时保持原有的服务水平,且不中断生产工作负载。

无以伦比的极致精简技术

3PAR存储系统中独有的零检测功能

使用3PAR Thin Concersion(精简转换)软件只需三个简单步骤即可实现容量精简,首先使用现有的卷管理器或文件系统对删除的数据进行清零处理,然后在3PAR InServ服务器上激活3PAR Thin Conversion (精简转换)软件,最后将原有卷迁移至3PAR InServ服务器即可实现数据精简。

不仅如此,3PAR认为,数据精简较为简单,难点在于如何持续精简。在这方面,惠普提供了一个名为“纳米级”回收的功能,其可对删除的空间进行回收,还可检测到不小于16k大小的零数据,并对其进行重新回收使用。

自动分层存储,让负载动态优化

3PAR Adaptive Optimization(自适应优化)软件是3PAR存储系统中的一个功能套件之一,该软件能够实现3PAR InServ存储服务器存储子卷的自动分层功能,可使得企业热点数据在SSD、FC磁盘以及NL磁盘中进行动态转移,以实现性能的提高,并有效降低企业成本。

自动分层存储,让负载动态优化

3PAR中的自适应自动优化功能

3PAR自动和细粒度的服务级别优化方式旨在适当的时间将适当的服务质量(QoS)不中断和持续地提供给适当的数据,以减少企业和云数据中心的成本。由于Adaptive Optimization(自适应优化)可在子存储卷层面进行,因此采用了固态盘的InServ阵列只需要更少的优质驱动器即可满足哪怕是最苛刻的性能指标。通过3PAR Adaptive Optimization(自适应优化)软件,InServ阵列能够在单一卷中整合多个存储层(使用任何形式的SSD、光纤通道、近线(企业级SATA) 驱动器的组合),从而实现所需的服务级别,并且每Gb的总成本比只使用光纤通道的配置要低的多。

自动分层存储,让负载动态优化

3PAR动态优化功能所能实现的性价比

惠普3PAR存储系统是一个真正的全虚拟化阵列,其通过将存储系统内部的硬盘通过特定方式实现颗粒化,然后根据应用对存储性能的不同需求,来选择合 适的颗粒组成一个虚拟盘,这个虚拟硬盘中包含了性能最好的SSD,性能较好的FC磁盘以及性价比较高的近线磁盘。这样就使得3PAR存储系统中的自动分层 存储技术允许一个数据卷可以跨越不同的磁盘介质,例如一个卷可以跨越SATA、 SAS、SSD等不同的介质,3PAR的自动分层存储管理软件可以监控到这个卷里面的访问频次不同的“热区”和“冷区”,将访问频次较高的“热区”移动到 SSD介质上,访问频次较低的“冷区”,自动迁移到性能较低的近线磁盘上。这样不但实现了完全的基于策略的自动数据迁移,而且每次迁移,不用再迁移一整个 卷的数据,只需要将一个数据卷中较热部分的数据迁移到SSD硬盘区,因而充分提高了SSD硬盘的应用效率。

与众不同的数据保护

作为存放企业重要数据信息的存储系统来说,其可靠性永远是居于第一位的。传统存储所采用的RAID数据保护方式在海量数据背景下越来越难发挥出其应 用的作用。举例说来,例如我们所常见的利用四块磁盘组成一个RAID 5阵列,其每块硬盘的容量为2TB,如果这个阵列中的某块磁盘损坏,需要数据重建,那么2TB容量大小的磁盘重建所需要的时间大约是在4小时左右。因为同 一阵列中的磁盘其生命周期基本上是相同的,那么其同时损坏的几率并非不可能,尤其是在海量数据存储需要的大规模磁盘阵列情况下,如果在数据重建过程中,一 旦另一块磁盘出现损坏,那就意味着数据丢失。

当然针对这种状况,已经有一些新兴的数据保护方式开始出现,如擦除码,飓风码和喷泉码等,再如IBM所看重的XIV存储系统中所采用的伪随机数据分布方式等。在3PAR存储系统中,其也有一种独到的,让人眼前一亮的数据保护方式。

3PAR存储系统中的数据保护方式是基于前文所提到的全虚拟化系统而来的,物理磁盘按照一定的方式被分为同等容量大小的小型存储空间,并将这些小的 存储空间按照应用需求组成不同的虚拟磁盘(其中包括SSD、FC和NL磁盘)。一旦3PAR中某块硬盘损坏,需要进行数据重建时,其将丢失数据重建到新的 三块硬盘之上,这样就可大幅缩减数据重建时间。

因为我们要明确的是,传统RAID方式数据重建时间的最大瓶颈在于磁盘本身,即磁盘的性能瓶颈决定了其数据重建时间。而采用惠普3PAR的这种方 式,则相当于是同时将(损坏的磁盘上)分散在N块硬盘上的数据同时重建到另外的N块硬盘之上,其重建数据的性能是N块硬盘性能相加,其数据重建时间则是单 块硬盘的N分之一。

除了上述的方法使得数据重建时间大幅缩短之外,前文所提到的零检测功能。在3PAR存储系统之中,其能够对磁盘中的零数据进行检测,在遭遇零数据 时,传统的RAID方式在数据重建时仍是会利用校验机制对其进行运算、校验。而在3PAR存储系统中则不会对其进行校验,直接跳过,这也从另一方面减少了 磁盘损坏后的数据重建时间。

后记:实际上,3PAR 存储系统的技术特点与亮点功能还远远不止上述。存储是企业IT系统中的特殊存在,因为其存放这几乎可以说是决定企业生死存亡的数据信息。从存储发展的这么 多年来看,为了保障企业的已有投资,其所推出的产品必须要向下兼容,而这也间接地阻碍了存储技术的革新。而作为3PAR这样的新兴存储公司而言,却完全不 存在这类掣肘,其完全可以将一些具有前瞻性的技术和特色技术融入其中。

并且,惠普作为存储行业的老牌厂商,其已经在存储领域积累了丰富的经验,并形成了诸多行之有效的方法论。在惠普收购3PAR之后,将已有的经验与方法论同最领先的技术相结合,其产生的影响无疑是深远。

未经允许不得转载:存储在线-存储专业媒体 » 企业私有云存储产品巡礼:惠普3PAR一览