随着企业寻求融入到大数据的世界中——那里存满了数字化文档、邮件通信、Word 文件、Excel文件和其它非结构化数据,企业期望从中挖掘商业智能——他们需要解决当前的大问题:存储。
EMC Isilon的产品管理总监Nick Kirsch,表示:“企业的信息数量已经累积到了PB级,他们面临着类似的挑战:企业已经掌握了所有的信息,但是应该如何利用以及如何在易扩展结构上存储这些信息呢?”
一种可行的方案是纵向扩展(存储规模)。这个想法是通过以新的高容量设备替换现有的存储设备将现有的存储节点做得更大、更快、功能更强大。通过这样的方式巩固存储基础架构是很吸引人的,因为这样做简化了管理、减少了占地空间和电力消耗。但是这并不意味着这种方法是完美的,纵向扩展不能轻易的涵盖多个位置,不具有太多的内在整体弹性,而且大型高性能存储设备可能会非常昂贵。并且当你在处理不断增加的信息洪流时,最大的问题是:目前的存储设备容量只有这么大(即存储设备容量是有限的)。
“你可以建立一个越来越大的单一单元控制器,”Kirsch表示:“但是在某些时候,你不可能将它做的任意大,你必须增加第二个。最终你可能需要管理数百个独立的单元。”
相反,Kirsch认为水平扩展(横向扩展)NAS才是正确的途径。一个横向扩展的NAS放弃用昂贵的高容量存储设备作为用来合并成一个高容量存储池的存储组件,尽量添加节点而不是把节点变的更大。但是这样做的缺点是:你可能会很快以一个更为复杂的管理环境结束。然而横向扩展可以涵盖多个节点,并且具有很强的内在弹性。而且从大数据管理的角度来看,最重要的是你可以快速而且廉价的增加存储容量。
Kirsch坦言:“我认为我们所看到的最重要的事情同时也是对于存储来说最大的抱怨是:管理一个单元真的很容易,但是管理两个或两个以上的单元时就会变得非常复杂。”
“对于存储大型数据,NAS要比SAN更好”,Kirsch表示:“因为SAN主要目的不是为了处理非结构化数据和文件共享。为了使用SAN网络协议,如NFS或CIFS/SMB,你必须在SAN之前部署文件服务,这会造成额外的管理复杂性并且影响到系统横向扩展性。”
横向扩展NAS的五大信条
Kirsch认为CIO们在寻找横向扩展NAS架构时,应该遵循的五大原则的第一条是简单至上:
1、易于扩展的。“他们正在寻找的下一代架构应该便于扩展,”Kirsch表示:“如果我有1TB的硬盘,1TB是我可以管理、保护和复制的容量。 为什么我不能用相同的简单的方法管理15PB的容量呢?不能仅仅因为它的容量大就应该更复杂。”横向扩展NAS架构可以通过使节点行为和单一系统中的一样 在软件管理和虚拟化/抽象层解决这个问题。
2、可预见的。“系统的性能必须是可预见的”,Kirsch表示:“如果我在本周添加6TB容量并且将在下周添加6TB的容量,我希望这两个线性扩 展在性能上是相同的。我不希望重新设计我的应用程序或者重新培养我的用户。这种扩展应该只是以可预见的方式扩展。我希望随着容量的扩大它能被支付,不要让 我今天过度投资。根据摩尔定律,我可以预见到下个月计算速度会变得更快,硬盘密度会随着时间的推移更加稠密。让我的存储架构也拥有这种优势(可预见性) 吧,请让它成为共享对称架构,请不要强迫我去了解架构的差异性,请允许我在任何需要的时候扩展这个系统。”
3、高效的。“请让我利用我的存储系统中的所有的资源而不论它们在哪里”,Kirsch表示:“请让我获得物理磁盘驱动的利用率,让我的数据使用存 储容量的80%以上,而不是50%或55%。不管是CPU、计算机或者缓存在哪,请让我充分使用它们。无论应用程序在这里还是那里运行,我希望存储系统都 能最大限度的提高应用程序的性能。并且,请将系统分层。”
换句话说,你应该调整周围的数据以使系统性能最优或者优化存储容量。适用于大型数据的横向扩展NAS需要有足够的智能自动为你提供这些服务。
4、可用的。“系统必须是一直可用的”,Kirsch表示:“利用N-way架构的优势,允许我的系统可以在经历超过两次失败后还能继续运行,允许 我的系统在一个机架出现故障时仍然能正常工作。我希望能一直这样,而且更具有弹性。请让我调整系统保护的可用性和我的业务单元的需求保持一致。如果数据是 不重要的,我可以给它非配较少的可用性。”归纳起来就是,由于横向扩展的NAS存储架构是建立在硬件之上的,所以存在一个假设即硬件可能会出现故障,因而 系统必须被设计成能应对高硬件故障率的。
5、企业验证的。“由于技术已经成熟,横向扩展系统不再是IT之外的项目了”,Kirsch称: “它是IT的关键部分。它具有快照、复制、配额等其他所有传统IT的特性。这项技术真的演变出了一个HPC根,但是如果你打算建立一个向外扩展的系统,最终你一定要将它建设适应到企业环境中去。”