6月23日Cloudera对外发布了Cloudera Data Platform Private Cloud (CDP私有数据云平台)。CDP是2018年Cloudera与Hortonworks以52亿美元价格宣布合并之后,新公司所发布的首款新产品 ,对于双方的产品用户而言,对于CDP可谓是期盼已久,不仅如此,随着新产品的诞生,公司未来的发展战略变得愈加明晰。对于Cloudera新公司来说,这也是决定命运的一战。
Hadoop生机盎然
熟悉大数据发展历程的人都知道,现有Hadoop,后有大数据,因为有了大数据,才有了全量数据分析,可以说,大数据分析是数据创新、数字经济的基石。
作为大数据代表企业,Cloudera红极一时,得到资本的追捧。2014年,Cloudera被英特尔引入到中国。Cloudera提供的主要产品就是基于开源Hadoop集群的各种组件和服务。从备受追捧的大数据,到英特尔等巨头企业的加持,Cloudera被寄予厚望。
“仲永之通悟,受之天也,贤于材人远矣”,但是受制于多种因素的制约,“泯然众人矣”也是多少让人没有想到的。在很多外界评论看来,Cloudera与Hortonworks合并,俨然断尾求生的无奈之举,为此,有评论认为 “Hadoop已死”,这里的Hadoop,显然是说“Cloudera或者Hortonworks”。
相比Cloudera,从AWS的EMR,谷歌的Dataproc,到Azure的HDInsight,阿里云的E-MapReduce,公有云大数据服务生机盎然,以Hadoop集群为基础,Spark、Hive、流数据分析等开源组件业已经成为数据业务创新所无法获缺的技术。
“Hadoop之外,至今还找不到可以替代的技术。” 大数据之父Cloudera 首席架构师Doug Cutting在接受采访时说。
100%开源,100%付费
痛定思痛,Cloudera开始蜕变。
蜕变首先从商务经营策略开始,CDP之前, Cloudera商业Hadoop版本CDH,Hortonworks的HDP,以及社区开源版本并存。Cloudera、Hortonworks通过商业化服务获得收入,其中的商业软件工具并不开源。从实践结果看,这种策略并不成功。
从CDP开始,Cloudera采用100%开源策略,采用类似红帽的订阅收费的策略,用户付费就可以获得100%开源代码以及服务。免费开源版本宣布取消。
对外发布的CDP有两个版本公有云版本和私有云版本。
需要引起关注的是:这两个版本不是彼此孤立的,提供版本中包含的SDX(Shared Data Experience),基于容器化的访问、共享的统一数据湖、简化业务隔离以及多租户等数据安全管理策略,用户不仅可以构建数据应用云平台,也能够实现基于多云的混合云管理。
对Kubernetes、OpenShift 4.3平台支持,是CDP的技术亮点。
此前在Hadoop集群应用中,用户通常会支持多个应用。应用构建的时期不同,开源组件版本也不一样。当有些创新应用使用某些功能时,需要高版本支持,相比以前的应用则是基于低版本开发,由于应用之间没有隔离,当创新应用需要高版本时,就要求旧应用也要随之升级,当应用需求比较多的时候,管理的难度和成本大大增加。
在新的CDP版本中,由于提供了Kubernetes平台的支持,因为可以很好进行应用的隔离,使得单一应用的升级,不影响其他应用的环境。
此外,在资源管理调度以及安全策略管控上,CDP应用部署更加简单。
采用新的CDP数据云平台,可以在几分钟内完成私有云数据平台的部署。
谈到CDP的市场前景,Cloudera大中华区总经理徐晋表示:“在国家新基建政策的倡导下,云计算作为中枢技术正加快在各个重点行业内的应用和渗透。对于企业级客户来说,构建以数据为中心、面向多云的私有云平台,是更经济安全、支持新一代应用和保护已有投资的最佳选择。CDP私有云正是为了满足这一市场需求而生,为企业的核心IT系统提供业务创新所必需的稳定性和敏捷性,从而充分发掘数据价值,快速满足业务需求。”
小结
很多人会被CDP私有云的提法所迷惑,也容易将其与OpenStack混为一谈,也许CDP私有数据云平台的更能够表达其价值,也就是基于云环境的数据分析、处理和应用,创造数据价值,当然也包括对于机器学习、AI数据应用的支持!
从这个意义上说,Cloudera并没有偏离大数据应用创新的主战场。涅盘归来,Cloudera能否带来足够的惊喜吗?
拭目以待!