DOSTOR存储在线 6月6日原创报道: 存储行业正在面临前所未见的关键问题:数据量激增、非结构化数据激增、移动设备带来的数据类型激增,这些问题虽然让存储行业在IT行业中率先走出经济危机,但所带来的“存储重压”和“数据雪崩”,却可能让存储行业重新陷入危机,技术的危机。
存储行业正在通过不断的技术创新与产品革新来应对这些危机,消减数据量激增带来的容量影响,尽可能多的、快的存储非结构化数据,解决移动设备带来的多种数据类型的管理与存储,最新的解决方案是“统一存储”,这是一个新阶段的统一存储,不是简单的网络接入的统一,而是将块数据、文件数据实现统一管理,将不同类型数据的管理、数据保护、迁移与利用统一化。
不过,统一存储对于现在来说还是相对很新的——这意味着我们还在接受循环的早期,也意味着我们有更好的让统一存储服务于企业存储环境的机遇。
有一点是明显的,统一或者多协议的存储有十分诱人的价值优势。在一个统一存储环境中,数据存储变成了一个共享的资源池,来存储块的或者文件数据,并根据应用需求来配置。所以用户非常有兴趣来实施统一存储平台就不足为奇了。
所以,在最近的一个对306个有存储规划或者决策职责的IT专业人士的调查中,才会得到如此令人欣喜的数据——尤其是对于存储主流供应商来说:ESG(Enterprise Strategy Group)发现在受访者中有70%已经或者正在计划实施统一存储,其中有23%已经实施了这个技术,47%的仍在规划阶段。
受访的IT用户中每四个就有一个实施了统一存储,这个数字十分惊人,因为数据存储用户在接受新技术上通常都是保守的,而且有其理由:“如果它没坏,就不要修它”,这句话在存储架构团队中十分流行。换句话说,没有人会在存储系统上做太大的改变,除非他们不得不做出改变。
这说明统一存储不仅是趋势,而且是当下应用存储系统的最佳选择,但问题是,统一存储是否足够好,好到我们现在就有足够多的选择?在主流的存储供应商相继推出统一存储系统之后,统一存储的背后推动力量是否强劲有力?
" "
统一存储实现突破:红遍大江南北
主流的存储供应商在2010-2011年,全部都进入了主流的统一存储市场,包括IBM的StorWize V7000 Unified、EMC的VNX/VNXe、戴尔的PowerVault NX3500和EqualLogic FS7500莫不如是其中的代表,NetApp更是持续的推动其基于NAS文件存储系统的统一存储系统。值得注意的是,EMC竟然用提供统一存储能力的EMC VNX系列替代了原本只支持SAN存储的EMC CLARiiON CX系列存储系统,要知道后者可是EMC十余年的中端存储核心系统,这也从一个侧面说明,像EMC这样的主流存储供应商都对统一存储的未来非常看好。
但主流供应商的追捧并非是统一存储系统如今红遍大江南北的主要原因,与每一个产品市场相同,存储市场的推动是依靠着用户的大量需求的,统一存储系统如今成为主流,最重要的还是来自于企业对大数据、非结构化数据以及块数据与文件数据融合的需求。
非结构化数据是推动统一存储的第一个激发点,从著名调研机构IDC对于结构化和非结构化数据增长的统计情况可以看出,非结构化数据的增长远远超过了结构化数据的增长,据其预测,2012年,非结构化数据已经占所有企业数据的80-85%,而且增长速度远远超过结构化的块数据,这也就意味着,非结构化数据已经成为企业数据存储挑战的一大难题,而随着企业决策者更加迫切的希望从非结构化数据中挖掘出更多有用的商业价值,对如何更好的存储非结构化数据提出了新的要求。
第二个激发点来自于用户对于“一体化”存储及存储管理的需求,大量的企业都在过去十年建立了块数据存储的SAN存储网络,并且随着大数据的增长,不断的扩张和升级了其SAN存储网络,形成了一个庞大又复杂的块数据存储网络。虽然依靠NAS文件存储系统能应对非结构化数据带来的绝大部分压力,但随之而来的是块数据与文件数据的“分而治之”产生的数据孤岛,以及复杂的、分割的数据管理方式——极大的降低了企业数据存储、管理的效率和可靠性,带来了较高的成本。
虚拟化环境则带来一个更大的挑战。使用基于X86开放架构的物理服务器及英特尔为至强服务器提供的强大的虚拟化能力,新虚拟服务器和应用可以只用以往在物理世界中所花费的一小部分时间就可以完成部署,而虚拟机的大量混合出现,则意味着单一的文件或是块数据存储将在物理服务器的IO上不再存在——它们一定是混合的。一个流动的虚拟服务器环境需要一个流动的,可以迅速响应的存储环境。如果我们将虚拟桌面VDI再纳入其中,会发现事情远比我们要想的还要复杂——甚至是比我们所能够预想到的最糟糕的情况。
此外,云计算需要更加融合的IT基础设施,IT系统越多、越复杂意味着云的耦合程度越差,云的服务质量和连通性也就越差,新一代的统一存储产品简化的存储系统,将块数据和文件数据都完全资源池化在云的资源池中,在云计算时代为应对云的IT即服务、大数据等问题提供了良好的解决之道。
从这些情况来看,也就不难理解为什么当下统一存储系统如此火热了,统一存储不仅提供了更好的数据存储应用模式和管理体验,更重要的是它顺应了用户的需求,满足了云计算、大数据时代的块数据与文件数据的统一管理、统一存储的重要需求。但是谁是统一存储系统的幕后英雄呢?又是谁让块数据和文件数据存储统一存储时的满足用户的性能与可扩展性?
" "
X86架构:统一存储的幕后英雄
我们看到,目前业界流行的统一存储,是在传统的双控制器中低端存储系统(SAN)基础上,加入文件访问(NAS)能力,以满足用户同时使用块存储与文件存储功能,并统一管理的需求,此外还需要提供一定的横向扩展能力以满足用户数据和业务量增长的情况。这也就对统一存储系统的设计和控制器(处理核心)的采用提出了较高的要求。
不过,我们目前看到的EMC VNX、IBM StorWize V7000 Unified等产品在架构上具有非常好的灵活性,能够实现灵活地扩展,而其背后的原因,正是他们都是基于X86开放架构设计的——这些产品中所采用的文件模块节点都是基于X86架构的(确切地说都是基于英特尔至强处理器家族的)——正是X86架构的开放性、灵活性以及扩展性很好地突破了产品在架构、性能等方面的缺陷,从而满足了当前用户变化多端的新需求。
基于X86处理器的全新统一存储可以说划分了统一存储系统发展史上两个不同时代,在X86平台进驻统一存储系统之前,传统的统一存储产品架构受限于控制器,控制器存在着瓶颈,用户升级只能通过升级控制器处理性能和容量,僵化的架构非常容易出现性能瓶颈,并且在规模和可管理性上有着很大的限制;而与过去的统一存储产品与技术相比,基于X86架构的、云计算时代下的的统一存储在产品架构理念、技术、升级保护等方面有着众多改变,不仅有更好的成本经济效益,更重要的是能够满足了企业对数据存储系统——尤其是在大数据的数据爆发情况下——高性能、高可扩展性的需求(横向扩展)。
在统一存储系统中,块数据和文件数据正在不断融合,但由于块数据和文件数据本身在存储系统中的存储方式存在巨大差异,统一存储系统需要同时面对块数据和文件数据的混合型负载——SAN+NAS网关的方式对NAS网关性能又有着很大的、迫切的需求。X86处理器在混合不同类型的数据、提供高性能等等方面有着强大的优势,X86开放架构处理器能够以不断提升的性能以及极强的适应能力,满足统一存储对数据处理性能及混合型负载的要求。
另一方面,X86开放系统的构建和部署也非常之快,强大的横向扩展能力——X86架构可以非常容易进行Scale-Out向外扩展,而不用受限于传统的控制器架构——将显著提高统一存储系统的扩展能力——X86架构能够很好地帮助存储系统进行有效、快速的扩展——消除了单个独立的设备,给数据中心管理人员的运维工作降低了很多难度。
以IBM的Storwize V7000 Unified为例,其管理节点、接口节点和存储节点这三种完全不同的角色被凝聚到一对文件模块节点中,硬件平台就是IBM的x3650服务器,在单一的管理界面下管理块和文件数据并提供数据快照的能力。Storwize V7000 Unified不仅具有较强的横向扩展能力,其性能也是出类拔萃的,使得IBM正在逐步将中端存储的重点迁移到Storwize V7000产品系列上,而不是传统的DS5000系列存储产品。
总的来看,可以说X86架构及X86处理器是“统一存储的幕后英雄”,在混合负载的性能和统一存储系统的可扩展性和功能性上都带来了显著的用户受益,现在,X86开放架构处理器增加了全新的成员:英特尔至强E5处理器,作为英特尔最新推出的服务器与企业存储处理器,至强E5将推动统一存储更加“淡定的”面向大数据与非结构化数据的挑战。
" "
至强E5推动统一存储面向数据挑战
或许很少有人知道,EMC VNX、IBM StorWize V7000 Unified、戴尔PowerVault NX3500、EqualLogic FS7500以及NetApp的FAS系列产品,都是基于英特尔至强处理器而设计制造的,英特尔至强处理器已经成了名副其实的“统一存储系统市场的核心”,而至强E5不仅将稳固这一局面,更会加强统一存储系统的性能、功能与能耗表现。
英特尔新一代至强E5处理器的提升极为显著,除了处理核心数量由最多6变成最多8个,其他最为显著的改进包括:内置PCI-E 3.0控制器、QPI速率由6.4GT/s提高到8.0GT/s、内存速率由DDR3-1333升级至DDR3-1600,并可使用LRDIMM(Load-Reduction DIMM)以支持最高32GB单DIMM容量,同时内存通道数量由3个增加到4个。
至强E5相对于前两年从至强5500到至强5600的提升,其变化是非常显著的,功能和特性上的提升明显要比至强5500到至强5600要多得多,而且可以看得出大部分都是对性能有着关键影响力的提升,在这些提升中,有不少与存储系统或是统一存储系统有密切的关系。
当然首推的是至强E5令人吃惊的能效表现,这对于一直在性能方面无法达到纯粹SAN或NAS的统一存储用户来说,是改变统一存储系统性能目前略欠火候的重要机会。至强E5的每一个测试几乎都指向同一个结果:至强E5的性能提升远远超过了上一代产品的提升,以上海交通大学网络信息中心高性能计算部主任林新华的测试结果为例,他表示“我们计算新建一个高性能计算中心。在应用我们自己的KLAPS应用程序进行测试时,至强E5的性能比前代提高了82%。”而且,这还是应用未经过优化时的测试结果。
更高的处理器性能自然能够带来统一存储更高的性能表现,X86开放架构处理器的横向扩展能力自然不必再说,英特尔至强E5系列处理器完全有可能将统一存储推动到前所未有的性能的巅峰,但在英特尔至强E5系列处理器中,有一项特性将极大地丰富统一存储系统功能,并同时将大幅度的加速统一存储的IO性能。这就是英特尔在至强E5中首度嵌入的PCI-E 3.0控制器。
至强E5刚刚发布的2600版本是每处理器提供40个PCI-E 3.0线路,双处理器配置可达80个。虽然与PCI-E2.0相比,PCI-E3.0的传输率只是从5GT/s提高到了8GT/s,但由于采用了更为高效的编码方式,实际带宽接近倍增的效果,所以至强E5-2600的PCI-E带宽比至强5600提高了一倍有余。并且,因为PCI-E3.0直接挂接在处理器上,省去了QPI和IOH的中间环节,I/O通路缩短的结果是响应时间的下降,有利于改善传输的延迟。
因此,如果供应商基于英特尔至强E5产品系列更新统一存储系统,那么许多高性能的或是用于加速的设备如PCI-E闪存卡、千兆/万兆网卡、存储HBA等都可以通过PCI-E 3.0直接连接到至强E5-2600处理器上,不仅让统一存储系统获得更高的性能表现和更低的IO延迟。供应商在统一存储系统中也可以利用PCI-E闪存卡、千兆/万兆网卡、存储HBA等丰富自身的功能,获得如PCI-E加速卡这样的系统加速组件。
既然有可能极大的提高统一存储系统的性能,丰富其功能,至强E5的出现显然将不仅仅停留在服务器领域,统一存储系统同样呼唤着这样的产品成为其计算的全新核心,随着至强E5慢慢为存储供应商所接受,成为市场上主流的产品,至强E5必将推动统一存储架构的不断前行。
" "