EMC World大会昨天早上在拉斯维加斯拉开了序幕,这是EMC收购Greenplum和Isilon后最重大的一次会议,EMC宣布了世界上最大的文件系统(15.5PB),以及Greenplum部门开源模式的成功。
所有公告都符合“云计算相遇大数据”的大会主题。
EMC去年收购了Greenplum——它凭借这个领域的战略一鼓作气动摇了多个市场——特别是大数据、开源、分析和非结构化数据。
Greenplum创始人Scott Yara现在运行着一个新的EMC数据计算产品部门,创建了一个包含Greenplum软件的数据仓库设备,未来将会集成VMware、SAS数据分析和Apache Hadoop平台,即所谓的下一代基于云的数据仓库/分析平台。
Yara说:“Apache Hadoop已经成为重要的数据技术和非结构化数据处理平台,Hadoop在我们大数据/分析堆栈中扮演着极其重要的角色”。
Apache Hadoop是一个受Google MapReduce和Google文件系统实现启发的开源技术,它是一个支持数据密集型分布式应用程序的软件框架,适用于大规模数据分析和存储、Yahoo、Facebook、eHarmony、Twitter、和eBay等都在使用它挖掘非结构化数据的价值,当前,大多数数据都是非结构化的。它结合了软件,商业硬件和简单的互联。现在EMC Greenplum已经为企业准备就绪。
Greenplum发布最新数据计算设备
使用Hadoop技术的EMC Greenplum HD数据计算设备还结合了实时深度分析和大规模向外扩展存储技术。
Yara说:“我们可以跨结构化和非结构化数据同时进行分析,两个引擎可以一起运行,一个查询可以从两个引擎拉取数据”。
Greenplum HD社区版本是一个基于虚拟机的设备,具有贡献给Apache Hadoop的所有核心功能,换句话说,EMC正高姿态地拥抱开源社区。
Greenplum HD企业版本功能比社区版本更强,添加了一些高级功能,满足大型企业,关键任务环境的需要,包括数据管理功能,如快照、广域复制、简单数据载入和使用原生网络文件系统(NFS)接口访问,以及端到端管理,包括简单集群部署,自动故障转移检测和通知,多站点管理和滚动升级。
对于企业版本,EMC一直和初创公司MapR保持合作,后者正在开发一个更快的Hadoop版本,MapR的CEO John Schoeder将在EMC World上走到台前,并公开介绍MapR如何让构建,部署和管理Hadoop变得更简单。
Schoeder说:“我们对Hadoop做了拆解,只让它支持数据分析,因此速度变得非常的快,你只用一半的硬件,都比其它任何Hadoop版本运行得要快”。
EMC的大数据平台利用了使用英特尔处理器,SATA硬盘,JDOB存储系统的商业服务器,本季度晚些时候将会有一个软件发行版可用。
Evaluator 集团资深合伙人John Webster说:“Hadoop在从传统数据仓库向大数据分析平台转换过程中扮演着领导者角色,EMC的Hadoop商业化战略旨在为企业用户简化和强化Hadoop,让Hadoop成为企业离不开的实时分析工具”。
EMC Greenplum HD社区版、EMC Greenplum HD企业版和EMC Greenplum HD数据计算设备有望在2011年三季度上市。
Isilon发布大数据NAS平台
EMC Isilon存储部门总裁(即Isilon创始人)Sujal Patel以NL系列为中心宣布了更多大数据解决方案,在一个文件系统上将存储容量推到了15.5PB的极限,EMC Isilon 108NL在一个4U节点上使用了3TB日立硬盘。
Patel说:“我们创建了世界最大的单个文件系统”。
IDC分析师Rick Villars认为这对大数据的未来是非常重要的一个进步。
他说:“使用一个简单的,可扩展的,高度灵活的存储基础作为IT基础设施的核心,实现大数据的商业价值,向外扩展NAS就是这个基础,Isilon的新产品兑现了它的承诺,提高了性能,扩展性,简化了大数据的汇聚,使实时协作成为可能”。
此外,108NL还带来了Smartlock软件,为大文件系统提供了一次写入多次读取(Write Once Read Many,WORM)的功能。
Patel说:“一旦锁定,文件就不能以任何方式被移动或修改,每个受保护的文件都拥有一个唯一的,可验证的签名,确认它的完整性和在文件系统中的状态,和Isilon的108NL结合时,Smartlock为近线大数据归档提供了最高级别的保护”。
Isilon 108NL硬件产品和Smartlock软件已经推向市场,现在就可以买到,108NL每节点的标价是123500美元,Smartlock每节点的起价是1950美元。