DOSTOR存储在线10月14日国际报道:EMC开始推出Greenplum Data Computing Appliance(DCA:数据计算设备),并承诺该产品的性能是Oracle的Exadata系统的两倍。
DCA是一个在线分析处理(OLAP)引擎,用于观察和挖掘商业交易数据并从中提取有效信息以更好地描绘客户行为,从而帮助企业提高竞争力,比如说帮助手机提供商降低客户流失率。
DCA使用Greenplum的大规模并行处理和无分享架构。每个机架内有16个分服务器,每个服务器使用两个英特尔Xeon E5670 6核2.93GHz处理器,因此总的处理器核数量为192个。每个机架还拥有两个冗余服务器来用于协调操作,这些服务器并不进行数据挖掘工作。
整个系统可以整合最多24个机架,也就是总共4608个数据挖掘处理器核。一个DCA机架有36TB可用未压缩磁盘空间,使用600GB驱动器。EMC表示如果进行压缩的话,空间数量可以达到144TB。压缩比率取决于数据类型,这里EMC使用的是通常的4倍压缩比率。
DCA是一个整合的IT堆栈系统,包含数据库、计算、存储和网络资源。它可以设置为半机架、全机架和多机架,通过压缩可以扩展到3.46PB容量。
Greenplum创始人,也就是现在的EMC数据产品事业部首席技术官Luke Lonnergan表示:"我们不需要任何过于深奥的东西。"
他表示现在我们需要用大规模并行系统来摄入大量数据、挖掘这些数据并快速得出结论。
客户可以把DCA和EMC的Data Domain重复数据删除备份、恢复和复制技术整合在一起。EMC针对灾难恢复的RecoverPoint产品也提供复制功能。
该硬件运行4.0版本的Greenplum数据库,同时EMC承诺提供"数据仓库业内最快的数据载入速度和最好的性价比"。
Lonnergan表示:"设备模式的优点在于它采用的是受过检验的成熟的技术,缺点是许多这种产品是架构孤岛。"
"DCA可以部署为单独的设备。启动它,然后数据就会输入,结果就会流出。不过你需要把它连接到你所选择的EMC阵列上,用RecoverPoint来复制它,并把它备份到Data Domain。"
"因此,现在你是在生产阵列上存储数据,进行连续的长距离远程复制,备份到重复数据删除存储,使用内置的完整性检查和带宽优化后的复制功能……我们的这个设备在你的数据中心中不再是孤岛,它是架构的一部分。"
Greenplum 4.0数据库作为单独的软件来出售,运行在X86硬件上,比如,EMC所建议的虚拟计算环境(VCE)联盟Vblock架构包。DCA产品将马上上市,价格尚未披露。