Greenplum Chorus问世 EMC完善大数据三部曲
许振新 发表于:12年04月19日 06:00 [原创] 存储在线
EMC大数据三部曲
EMC是最早提出大数据概念并将大数据作为重要发展战略的厂商之一,因而当很多厂商还在炒作大数据概念的时候,EMC已经能将大数据解决方案真正落地了。蔡汉辉指出:“企业用户只需要三步,就可以实现EMC大数据之旅。”
EMC大数据三部曲的第一阶段就是搭建云基础架构。在这个阶段,EMC提供给企业用户的产品有EMC Isilon和EMC Atmos。其中,EMC Isilon具有超强的横向扩展能力、可靠的安全保护和使用简易等特点,已经被苹果、华大基因、金山软件和浙江省图书馆等企业和单位所采用;EMC Atmos则具有海量、智能、灵活等特点。此外,EMC还提供了Greenplum Database和Greenplum HD,为大数据平台提供大数据分析工具。Greenplum Database主要针对结构化数据,可以分析PB级数据,它具有每小时10TB数据的分析能力;Greenplum HD是EMC的独门“武器”,它可以将非结构化数据转化成结构化数据,然后让Greenplum Database来高效地处理。
大数据之旅的第二阶段进入数据科学协作和自助服务。这个阶段会出现社交化风潮,并催生出企业中“数据科学家”的角色,成为驱动大数据处理的新兴力量。EMC最新发布的Greenplum Chorus,就是一个社交化的数据处理平台,能满足这一阶段的要求。
第三阶段就是实时决策,支持大数据的应用程序,实现数据货币化。EMC在今年3月收购了Pivotal Labs公司。PivotalLabs的加入,可以让数据集在Greenplum Chorus完善,让企业用户使用类似Ruby onRails(一个使用Ruby语言写的开源Web应用框架)的现代编程环境,快速构建大数据应用。
关于大数据三部曲的践行顺序,蔡汉辉认为不必完全按部就班来做,但是从他多年从事数据处理的经验来看,只有一步步做扎实了,后续的工作开展起来才有信心。