数据存储产业服务平台

EMC:IT进化到“以数据为核心”的阶段

他是IBM IT技术创新者最高荣誉IBM Fellow的获得者;他领导过IBM“网格计算”战略;他是EMC公司院士及杰出工程师评估委员会的创始人和主席;他在EMC设定技术方向上扮演着重要角色。多年来, 他一直走在IT技术变革的最前沿,他就是EMC高级副总裁及CTO Jeff•Nick。近日,Jeff•Nick先生接受了Watchstor独家专访,畅谈了对云计算、大数据等热门技术的看法。

从网格计算、云计算到大数据—这是场进化论

回顾过去十余年的IT发展历程,网格计算、云计算和大数据是不可饶过的三大话题。网格计算曾经轰轰烈烈,最终却是无疾而终;云计算亦是风起云涌,逐渐走向落地之时仍不乏质疑之声;大数据现在风头正劲,引发的争论却也是最为激烈。每一场IT技术变革都有其背后的前因后果,无论网格计算、云计算还是大数据,甚至未来接踵而至的某个IT新概念,都需要从各方面去洞悉它们的本质。

EMC CTO Jeff•Nick则认为从网格计算到云计算,再到大数据,犹如一场IT的进化,他表示:“网格计算其实就是云计算的前身,以前我们称之为公用事业型计算,它主要研究如何通过互联网来实现资源共享和统一分配。网格计算和云计算其实是连在一起的。从技术成分来看,云计算和网格计算存在很多共性,比如在网格计算结构上部署一个应用和在并行处理多节点上共同运行一个Hadoop作业具有很多相同特性。”

图一:EMC公司高级副总裁兼首席技术官Jeff-Nick接受Watchstor独家专访。

事实上在IT发展历史中,如果某种技术不能够很好的商业化和市场化,那么这项技术即便再出色也不能够获得很大的市场认可和成功。EMC CTO Jeff•Nick认为云计算其实就是网格计算走向商业化的结果,他表示:“网格计算其实是来自高校和科研单位等做研究的圈子的呼声,是满足研究圈的需求,而云计算只不过是商业化或者商品化的IT。现在非常商业化的生命科学应用、天气预报应用或者油气勘探应用和过去网格计算所作的HPC功能界限已经非常模糊了,这就是云计算商业化的体现。”

Jeff•Nick还认为大数据会是云计算总体进化的下一个步骤,他表示:“其实让我们仔细分析一下云计算发展过程就会发现为什么会有大数据的产生。云计算第一阶段是推动了资源共享,这也是网格计算的一个特点;第二步是把应用放在云端,就是我们通常所说的SaaS服务(软件即服务);第三步是 PaaS平台的搭建;第四步就是统一的数据分析,也就是我们现在谈到的大数据。”

数据是未来的核心所在

基金公司动用Hadoop分析社交网络用户情绪来预测股票市场走势、大型零售超市通过分析商品位置数据来分析用户购买行为、购物网站通过用户点击数据来分析广告投放位置、油气公司通过分析各种勘探数据来寻找油气资源……诸多鲜活的案例似乎在告诉人们:一个数据分析的时代已经到来,一场挖掘数据价值的革命正在进行。

EMC 高级副总裁及CTO Jeff•Nick表示:“我认为经济现在不光在全球化,经济还在信息化。这种信息化的经济指的是人们渴望能够获得更多的洞察力和获得更多有利的价值。这些价值不仅仅是商业价值,还包括社会效益价值,而这一切则都依赖我们对信息和数据的制造、处理以及对它的快速响应。”

大数据时代已经到来,大数据所带来的价值真如厂商们描绘的那么美好么?事实上,大数据概念诞生就产生了比云计算以往任何IT概念更大的争论,对于大数据的质疑之声从来没有停止过,这种质疑可谓是全方面的,包括法律法规、商业价值、商业创新、技术手段等。比如在法律法规方面,对于企业自身而言,要想获得最为准确的商业洞察力,所希望获得的数据样本应该是越大越好,这无疑将超出企业自身业务数据的范畴,企业自身自然而然希望获得更多的外部数据,而这些外部数据来源的合法性如何去定义尚处于法律空白;又比如在数据有效性方面,企业每天有新增的有价值数据,也会有部分数据失去它的价值,如果去判断数据的有效性,如何去挖掘有效数据的价值仍然是需要企业去面对的一大难题。

对此,Jeff•Nick表示:“有句老话是‘车到山前必有路’。如果出现了一个问题,但利益的吸引又非常之大,人类社会总会找到一种方法去克服。我们不能忽视正在发生的现象是:我们正在整个数据价值链上攀升,过去我们做的仅仅是一些关系型数据库,而现在我们正在往上走,通过Hadoop做数据分析、做信息的横向扩展、实现云端的数据共享,这些其实都能够帮助我们从整个信息的生态链上产生更大的价值。” Jeff•Nick的观点让人想到网银的发展,网银从出现之初到现在一直面临着安全的问题,但网银并没因此而消失,反而得到极大地普及,并给人类生活带来了巨大的便捷。

除此之外,Jeff•Nick还强调了数据从量变到质变的重要性,他强调:“数据越来越像地球引力,数据量达到了一定程度就会引发量变到质变,就像地球引力一样,它的重要性就会显著提升。”

为此,Jeff•Nick特意举出了三个大数据有趣现象:“第一个例子就是私有数据云,我们发现现在越来越多企业在数据生成、数据分配上并不在传统的数据中心之内,很多企业开始专门建立专有数据的私有云,它本身包含多个数据中心,数据分析工作并不会集中在一个数据中心,把数据分析能力放在数据所在的站点去做会更有效,这也就是为什么私有数据云现正正在快速兴起;第二个例子就是共生数据云,这是一个联合的数据云或者合成数据云,比如Twitter如果对某个话题感兴趣,需要把这个话题相关信息提取,这需要强大的实时数据分析能力,Twitter可以将针对这个话题每个小时产生的数据包传输给另一家专门做数据的公司,这家公司对这些数据进行分析之后再将结果交换给Twitter,这就叫共生数据云现象;另外一个例子就是大数据分析对于社会福利的创造非常有利,比如在医疗领域,通过数据分析对于基因的研究,对个人医疗方案的优化,这是社会公益型的数据云。”

大趋势,不可逆。虽然大数据在商业决策和商业创新上仍然有着很大的质疑,但是经济走向信息化的今天,以数据为核心正在颠覆过去传统的商业模式。暂且不去讨论大数据对于商业创新有多大帮助,大数据给人类社会的福利、社会效益、商业模式优化的确有着广泛的应用前景。

如同IT转型到大数据时代一样,EMC同样谋求在大数据时代进行转型。EMC的转型的确给业内带来了诸多疑问,比如说EMC是否会进入服务器市场;与Cisco、VMware组成的VCE联盟的市场策略和发展方向;在集成化趋势越来越明显的今天,如何与那些综合性厂商进行竞争等等。针对这些,Jeff•Nick明确向Watchstor阐述了以数据为核心的EMC转型战略。

在2012年EMC World上,EMC公司展示了针对运行阵列中应用的专有服务器模块,这再一次引发了业内对EMC 将进入服务器市场的猜测,毕竟服务器就是服务器。Jeff•Nick则从产业和技术层面阐述了EMC为何这么做:“事实上现在业内正在发生的事情就是,IT基础模块围绕X86平台的产品逐渐走向商品化和普遍化。目前服务器和存储阵列基本都采用了英特尔处理器和闪存技术,这等于创造了把一些不同的IT 功能放在数据中心能够发挥作用的地方的机会。回顾传统的做法,与服务器相关就会固定在服务器中,与存储相关就会被锁定在存储阵列之中,为什么就不能把数据功能放在数据服务器之上?数据服务器为什么就不能是一种阵列?它们的底层构件都是一样的。比如一个查询命令,过去必须从阵列中调出数据块,然后通过网络传到服务器,这个服务器要根据自身查询的内容至少要扔掉90%的数据块,所以为什么不能够进行改变?整个查询部分不通过网络,在阵列中进行完成,把跟查询相关的数据直接发送到服务器。EMC为什么会想采用这种办法,其实是想实现更加智能的方式管理数据的服务。EMC可以实现端到端的完整的数据服务。比如 VFcache功能,可执行服务器、闪存、阵列全部层次的数据策略管理。”

实际上,无论是EMC还是其他厂商,目前都在做的事情就是希望能够将产品更加集成化,抛开过去各个产品各自处理的做法,通过高度集成化的产品来最大限度提升效率。更有甚者,将一些像数据库、中间件等关键应用进行深度的软硬件一体化集成来提供给用户,并且在市场上博得了大量眼球。Jeff•Nick谈及这种市场现象之时表示:“通过EMC做VCE联盟以及VSPEX来看,客户是非常习惯融合架构和集成一体化产品,客户希望能够把所有IT产品放在一个机器里面,把所有东西都当做一个IT硬件设备来对待。服务器、网络、存储是IT基础架构的三大基石,我们考虑的是在这三大基石之上来打造一个统一数据平台,以数据为核心,提供数据分析、数据去重、数据分层、文件系统等数据服务,对于用户而言,他拿到的是统一的、融合数据服务的设备。”

在这个集成的时代,综合性厂商似乎有着天然的优势,拥有全面产品线以及整合能力使得综合性厂商在集成化方面获得更广泛的市场认同,而市场上针对 EMC、Cisco和VMware组成的VCE联盟仍然有着不少质疑。比如,Cisco在自身刀片服务器之中采用了Fusion-IO的闪存卡,VCE联盟中Vblock将采用EMC的VFcache还是Fusion-IO产品?EMC 高级副总裁及CTO Jeff•Nick并没有正面回答这个问题,他表示:“EMC坚信的就是同类最佳技术才是用户的需求,客户会决定哪种技术或者哪种产品。同时,EMC也相信只考虑到利益的互补关系而非同类最佳产品的合作伙伴关系并不会非常牢靠。比如闪存策略,EMC具有最为全面的产品线,EMC在阵列中采用了闪存,VFcache保证服务器和阵列之间的数据一致性,FAST-VP技术能够很好的管理闪存数据,还有Xtreme IO技术,从整个堆栈的闪存技术来看,EMC无疑是最佳的。随着时间推移,我们相信还是同类最佳技术才是真正符合客户需求,也是客户的最佳选择。”

未经允许不得转载:存储在线-存储专业媒体 » EMC:IT进化到“以数据为核心”的阶段