EMC牵手Kaggle 打造大数据众包人才市场
IT168 发表于:12年10月25日 14:46 [转载] IT168
在纽约O’Reilly Strata Conference + Hadoop World期间,EMC公布了EMC Greenplum Chorus 开源代码,力求与数据科学平台商Kaggle合作让企业进一步挖掘大数据的经济价值。
据McKinsey Global Institute 2011年5月的一份报道《大数据:创新,竞争和产能的下一个前锋》透露,人才的缺乏导致企业需要利用大数据。这种人才的缺乏被广泛认为是大数据流行的最大障碍。EMC和Kaggle宣称已经通过整合GreenplumChorus开始着手解决这种数据专家的短缺,而数据专家们的社交平台Kaggle囊括了55000多名数据科学家。这一消息有望改变有数据问题的企业寻找和联系数据专家们的方式。
在传统的分析进程中,数据科学家面临面临着访问和共享正确数据的挑战。Greenplum Chorus有助于利用最好的分析应用来培养完整的数据科学生态系统。作为一个协作型的数据科学社交平台,Greenplum Chorus用户可以通过单一工具就可以增加产能,减少IT机构的管理负担,获得更好的可视性以及更快速地访问数据。
而Kaggle社区的成员可以选择通过Chorus来接活。在Chorus界面里,希望参与到Kaggle社区的Chorus用户会搜索,浏览,点击有兴趣合作的 Kaggle 社区成员的资料。通过安全整合Chorus和Kaggle API,用户可以从Chorus Workspaces透露相关信息,并发送安全信息。Kaggle将Chorus作为信息源,并将信息转发给合适的接收者。一旦Kaggle 社区成员查看过信息后,就可以直接进行回复和细节讨论,直至开始项目。
Kaggle和Chorus的整合为该行业带来了新的机会,方便用户围绕大数据实现协作效益,而且便于数据专家们拓展业务。
各公司的数据策略必须具备敏捷性。ECM 的Greenplum OpenChorus项目的目的通过开放Chorus代码,促进大数据应用和方案的普遍开发。
除了Kaggle以外,大量EMC Greenplum合作伙伴都表示为OpenChorus项目提供支持,而且会将自己的工具与方案与Chorus整合。这些合作伙伴包括:Actuate,ADVIZOR Solutions,Alpine Data Labs,Gnip,Informatica,Pentaho,Pervasive,SAS,Syncsor以及Tableau Software。
总裁引言
Scott Yara ,EMC Greenplum部门负责产品的高级副总
“个人,企业和社区的合作对于大数据分析的成功非常有必要。OpenChorus项目是EMC Greenplum大数据技术,策略和工具的一部分——大数据能帮助客户深入了解业务和数据经济价值,所以要把握时机开拓。”“成功取决于协作平台和大数据时代的问题:数据科学家的供需。现在,有了Kaggle及其有着55000多数据科学家的社区,我们相信我们正在永久性地改变数据科学的分析方式。”
Kaggle CEO Anthony Goldbloom说:“与EMC Greenplum的合作为现有的和未来的Kaggle 社区成员开创了令人惊喜的新机遇。这种合作关系有助于解决数据专家的短缺,公司才能发挥数据的所有价值。”
可用性
Greenplum Chorus源代码现在已经可以通过OpenChorus项目获取。Chorus和Kaggle的合作项目有望在2012年11月落地。现在,你就可以下载Chorus,找到你要的数据,将数据可视化,为项目提供资源,分析模式,共享内部情况以及协作,还可以为社区做出自己的贡献。