横向扩展的网络附加存储(NAS)已经来临。不过,如果你认为它已经存在一段时间,从某种程度上而言也可以认为你是正确的。但使用集群文件系统并围绕其建立的NAS远非真正的NAS。NAS意味着简单,这些家用的系统并不能满足这样的需要。
Isilon,如今已是EMC的一部分,可能是将横向扩展NAS付诸实现得最淋漓尽致的厂商。Isilon 大约在10年前进入市场,并努力培育我们了解横向扩展架构的价值。尽管过程如同向上攀登般艰难,因NetApp和EMC缺乏这样的架构,并淡化相应的需求。不过Isilon最终取得了成功。
NetApp意识到横向扩展架构的潜在价值并在2003年购买了Spinnaker Networks。尽管用了一段时间才完成所有的整合,但如今NetApp在横向扩展NAS领域已占据相当重要一席。Dell也是如此,在收购 Exanet之后,Dell现在提供将PowerVault和EqualLogic存储集成在Exanet软件后端。惠普同样步入收购之路并选择了 Ibrix,并将其放置在LeftHand 或 3PAR的前端。IBM使用了自有的通用并行文件系统(GPFS)作为其横向扩展网络附加存储(SONAS)的基础。日立最近收购的BuleArc,实际上也是横向扩展NAS的提供商。规模稍小的厂商,如Panasas和DataDirect Networks (DDN),也处于这个市场之中。Scale Computing,主要关注中小型业务/中小型企业(SMB/SME)市场,通过将IBM的GPFS架构在自身横向扩展块级存储之上,也提供横向扩展的 NAS产品。
每一个主流的存储厂商如今都已具有横向扩展NAS产品,并对此架构倾注了极大的热情。不过所有的横向扩展架构NAS系统并非完全一样。在选择购买某种产品之前还有一些事情需要仔细考虑。
如同不同厂商的块级存储之间存在差异,各厂商的横向扩展NAS产品也不尽相同。差别在于:
可扩展性,如何增加容量,基于性能的容量扩展,新节点的并入以及数据的重新分布
最小配置
节点的数量和类型。每个节点的存储容量
以吞吐量为主,以IOPS为主还是在两者之间取得平衡
系统的可管理性,对系统分区的能力
单个文件的吞吐量,单个文件系统的吞吐量
节点失效对性能的影响,最多可以失效多少节点而不丢失数据
在内部,数据是如何保护的,在系统易损期的数据重构时间以及系统是如何备份的
深入到每个因素的每一个细节会占据太多的时间和大量的篇幅,不过由于您的下一个NAS战略性采购很可能是横向扩展的系统,因此你必须做好准备。每一个厂商都声称它们的系统是可以无限扩展的,不过它们无一正确。无需理会理论上的限制,我们只需关注系统的实际限制即可。
其中一个最重要的考虑是运行在横向扩展系统上的应用是以吞吐量为主还是以IOPS为主。当Isilon最初面世时,它明确针对媒体和娱乐市场。这意 味着需要存储和访问非常大的音频和视频文件(应用以吞吐量为主),因此IOPS不太重要。不过当你需要处理大量的小文件和来自成千上万用户的请求时,这些 则完全与IOPS相关。
所有的横向扩展NAS系统都具有一个全局命名空间,不过在内部存在差异。例如NetApp,是将所有的小命名空间聚合成一个全局空间,而EMC Isilon提供OneFS文件系统来创建唯一的命名空间。这些差别未必和所有IT购买者有关,不过你还是应该了解这些差异。
一定要特别注意最初的起始配置。如果单独的节点功能非常强大,而你至少需要三个节点起配,那么你的起始配置价格可能会超出范围。如果对于你的应用来说单个节点能力远远不够,你可能需要太多的节点来构建一个合理的系统,同时你必须考虑电能、散热、空间以及成本。
你所选择的系统应能处理存储中随时间不断增长的文件数量,这一点至关重要。如果文件的数量数以十亿计(如Web 2.0应用或者归档系统),你必须特别仔细的挑选你所购买的系统。如今,很少的系统可以处理如此巨大的数量。这也就是为何大部分的公有云构建在基于对象的设计而不是集群文件系统之上。
最后,大多数人都认为横向扩展是未来的发展方向,也许你也会接受这个假定。不过你仍需要弄清楚那一种产品真正适合你的环境。我希望这些建议能帮助你取得基本认识并提出正确的问题。