EMC公司(NYSE:EMC)今天在EMC World 2012上宣布,1000节点集群Greenplum数据分析工作台(Greenplum Analytics Workbench)已经上线,该工作台将作为一种实验室环境使用,以加速大数据创新的步伐。Greenplum数据分析工作台的主要用途之一是,作为一种验证环境,验证Apache Hadoop代码库的可扩展性。EMC Greenplum事业部与Apache软件基金会展开了积极合作,以确保运用该数据分析工作台得到的数据分析结果能提供给开源社区,进而利用该工作台的资源进一步加速Hadoop的发展,使其成为革命性的大数据技术。来自全球数家领先软件及硬件公司的技术为Greenplum数据分析工作台提供了基础架构。
Greenplum数据分析工作台将用来测试横向扩展基础架构技术的限制,并用来探索大数据分析的各种应用方式。无论是与富有远见的学术机构就数据密集型研究项目展开合作,还是与大数据应用开发商合作,Greenplum事业部都准备让该数据分析平台为数据领域最具创新精神的思想家服务。
该1000节点集群也将供Greenplum的Hadoop培训及认证级成员使用。Greenplum将提供一套全面的Hadoop培训课程,向学员提供运用Hadoop所需的知识和编程技能,首批公开提供的课程将于今年夏天推出。Greenplum Hadoop培训课程的独特之处是,任何成功完成该课程的个人都将获准使用该1000节点集群,并将其作为一种沙箱环境使用。
Greenplum数据分析工作台是数家硬件和软件工作合作的结果,这些公司旨在共同促进Apache Hadoop的发展,使其成为大数据分析的重要工具。这些公司包括:
· EMC
· 英特尔
· Mellanox Technologies
· 美光
· 希捷
· 超微
· Switch
· VMware
除了1000多个硬件节点(或通过增加虚拟机达到10000个节点),该试验台集群还包括24PB的物理存储系统。如果将有记载以来人类全部书面作品转变成电子数据保存,那么24PB接近这些作品数据量的一半。