这可能会成为服务器技术的杀手组合:使用共享的、分布式的大数据的统一的对象存储。设想一下Hadoop集群,跨越了地域和云,内容可以像其他任何文件一样被处理。它可以帮助缩小目前大数据集群和关系数据库之间的差距。
Red Hat正计划这一行动,作为其现在所称的Red Hat Storage 2.0 (RHS 2)的一部分进行测试。公司的Tom Trainer,存储行业的资深人物,与ReadWriteWeb谈起过这个最新的未透露的革命。
让Hadoop少一个筒仓
“这不仅仅是兼容性;这是一个存取由机器产生的数据的一个创新的方法,这些数据被集合并放在多个HDFS筒仓内,”Trainer说。他指的是Hadoop文件系统,大数据架构的容错、分布式文件系统。”现在有条新路,一个寻找和揭示这些文件的新方法,并非常快速地将它们作为对象遍布企业周围。正如我们看到的一样,Storage 2.0可以储存HDFS文件,现在还可以储存NFS和CIFS文件,同时还有对象存储能力。”
他继续道,“RHS 2将能够把Hadoop文件作为多组文件取出,(但)作为对象,并且以新的创新方式把它们输出到其他环境来利用这些文件中的数据。Hadoop环境的信息获取性现随着Red Hat Storage 2.0被扩大了。”
在Hadoop架构中,“NameNode”是服务器负责用于管理系统中所有Hadoop数据集群的名字,元数据和位置的,无论它们在哪儿。其架构实际上非常简单,以Trainer的观点,有点太基础了。虽然它可以把一个集群中的identity映射到多个位置,从而实现非常简单甚至更强大的数据复制,但它所基于的文件系统却是相当初级的,或许是从老式的文件存储那里借鉴了太多的东西。
在RHS 2.0中,Red Hat的工程师们为对象存储机制想出了一个方法,Trainer解释道,要么与HDFS共存,要么就完全将之取代。
他说,后者可能更可取:“那将完全消除文件系统架构中的名字节点,从而改变Hadoop环境的整体性能特性,同时也改变了Hadoop环境的信息访问性特性。”
统一存储的争夺
EMC还使用“统一存储”这个词来指代其架构。在2011年一月,该公司推出了其VNX系统,目的是让客户将存储区域网络和接入网络的存储系统合并成为一个池。EMC也许没想到,在大约一年的时间里,自已会与一个纯粹的软件公司竞争,它的私有云策略是围绕现有的,普遍的,实用的硬件而建立的。
Trainer认为,在EMC系统中,存储组件可以共享同一个池,但它们还是各自分开的。“我们发现许多IT组织有存储农场,如果你愿意。如今,你有了存储环境,它已经被高层管理选定了,基于业务关系,业务需求,价格或一些在过去存储硬件厂商才有的独特的功能。当他们看到横向扩展的NAS需求,再看看市场上有什么,他们首先要在存储硬件厂商间进行选择——而且会有很大开销。如今,他们能够部署成本较低的实用存储和作为横向扩展的服务器,turnkey NAS,或者他们可以重新部署一些现有的存储服务器——这是个省钱的法子。”
Red Hat仍在接受有兴趣的公司加入管理RHS 2 beta项目的申请。如Trainer所称,这些都是愿意在非生产环境下建立一个现有硬件缓存的组织。尽管一些客户试图在生产环境下试用beta版——例如,存储多个非结构化文件,如视频——Red Hat不建议这么做。
“在Red Hat,我们有一个存储兼容性列表,这通常用于生产级产品。在我们的beta测试过程中,我们已经用它作为一个指南,为我们的测试客户指明我们要测试的各种服务器和存储环境,”Trainer说。有些测试者同意,而也有些客户提出的设备品牌不在兼容性列表之内,其中一些符合Red Hat的测试要求。
新的安全风险?
最近几天,RWW从分析师和专家那里听到了一个想法,就是用一个比较新数据模型与一个新的对象存储模型合并会产生潜在的危机,对于该风险安全公司还未充分查明。
我们把这个消息告诉了Red Hat的Tom Trainer。“之前曾经工作在一家三个字母的,单片机存储公司,”他说,“很容易就会把FUD(Fear, Uncertainty, Doubt,意思为惧、惑、疑)脱口而出并且说,‘我的天啊,这是个新的,未经考证,未经证实的,并有安全问题和潜在漏洞!’这句话适用于过去曾发布过每一个创新技术。”
如果网络安全公司对于漏洞的反应像喷泉一样,那可能至少在一段时间内,每个创新都是一个安全风险。这就是需要有beta测试的原因。Red Hat有着很好的管理beta项目的历史,Trainer表示他的公司正与测试者合作,重新界定防火墙边界和重定向工作流,使得随着数据访问的创新,安全性同样得以提升。