DOIT2013存储峰会报道 今日,以“数据造化 智见未来”为主题的2013中国存储峰会在北京盛大开幕。今年是DOIT正式成立十周年,也是中国存储峰会连续举办第九年。分论坛作为中国存储峰会的经典环节,再次引来现场嘉宾的的热烈参与。此次的大会分论坛包括:软件定义与数据中心论坛、云存储与数据保护论坛、大数据与行业应用论坛、2013中国闪存高峰论坛。其中大数据论坛作为当下的热点话题,加之其接地气的行业应用分享,现场气氛再次引爆。
CommVault系统公司北方区技术经理董剑波先生首先与现场观众分享CommVault公司的数据一体化管理解决方案,将如何帮助企业应对大数据趋势。
以下是董董剑波演讲的精彩内容:
董剑波:大家下午好,我是Commvault北方区技术经理董剑波,我相信在座很多各位同仁参加了上午的会议,我有幸听了一部分,上午部分大家领略到大数据的最新趋势包括整个行业的发展,今天我们这个论坛更多关注大数据我们如何应用帮助企业做好数据管理,做好最核心的数据价值方面的变革。变革这个词大家应该在今天会场说很多人都在讲,大家也在关注,硬件商也有很多变革,很多在讲固态盘、CSD,软件商也是包装成盒子在销售,一体机。我介绍一下我们如何在大数据的背景下去保护企业中最核心最关键的数据的部分。基本上我这个演讲包括四个部分。简单前面跟大家分享来自IDC包括大数据分析统计的信息,和大数据在行业应用和应用特点。第二部分就是大数据的应用实践,我们关注在企业管理,如何帮助企业做好基于大数据下完整的企业管理方案。全球Commvault做了很多大数据的案例跟大家做一些分享,最后是简单公司的分享。
大家有没有了解过IDC数字宇宙的调查,在全球范围内收集目前数据量有多大,中国市场大数据量到底有多大?大家都在讲大数据,都在讲四V,各个环节各个角度去看,数字宇宙从量上分析。从2012年到2020年这是一个预测,2012年数字宇宙整体规模全球范围达到364EB,过十几年以后这个数据成长到8600个EB,这个是一个什么概念?如果把8600个EB做成一本,这本书的厚度是地球到冥王星距离的30倍,达到1500亿公里。还有一个数据增长,按照IDC预测每年有50%,国内有些客户持续增强不止是50%,尤其做BI和平安城市,智慧城市这个数据成倍的增长。中国从2012年13%会占到全球的21%,这是IDC的预测,可以看出中国在大数据领域的地位也越来越重要。
另外一个维度我们看看在哪些行业,我们论坛是行业论坛,大数据加行业论坛,这个论坛里面我们了解一下行业应用有哪些?第一将近40%多的大数据应用在数据分析。各个行业、各个政府,包括企业都在做BI精分,其次是服务创新,越来越多的企业关注如何把服务做好,利用云服务,虚拟化的服务给用户提供完整创新的服务管理。第三部分在销售数据分析方面,这个大家亲身有感受的,明天又是双12,双11大家知道京东、淘宝创了历史最高,这些公司都会基于这些数据做分析,做销售机会分析和用户行为分析,这些方面都是导致大数据增长非常重要的诱因。还有一个维度我们关注一下大数据到底是什么类型的数据?包括我们公司包括在座很多关注在大数据领域的公司或者用户非常关注的,它到底是什么类型?我们数据类型是结构化、半结构化、非结构化。数据类型最多是非结构化的,一些文本的信息,一些邮件、表格现在大家用的微信这些及时消息,QQ这些都会是大数据里面最主要的一部分。其次是结构化的数据,交易数据、视频、音频,大家建设平安城市之类可以带来视频音频爆炸式的增长。我分析这些数据最终希望引入今天我们介绍的一个重点,我们看看在这样大数据的背景下帮助我们企业管理好我们数据,使我们数据价值发挥出来。有了我们前面看到EB级的数据,我们看看体面最重要的是什么?数据保护。企业花了很多费用人力、物力成本建设一个大数据的应用,他希望从里面挖掘价值,他希望看到帮助它企业成长非常有价值的数据,这些数据非常关键,怎么保护好?在有限备份资源做好保证数据的可用性,这个一定是给大家大数据给企业带来的改变,一定重新考虑现有备份的系统。我做了数据管理数据备份的技术,跟很多客户沟通的时候客户都会提出来一个问题,我数据做了很多备份,每年每天都在做,这些数据是不是有效,真正我想用的时候能不能完整快速恢复出来,这个是客户的困扰,这个数据有效的验证,大数据报告,这是最直观的内容。最后就是电子备份,很多公司上市以后面临行业和法律上审计,这时候有效数据能不能长期保存,以低成本的方式保存,这是应对合规非常重要的一部分。
我介绍一下我们大数据里面的最佳实践。传统上客户怎么做?我们无论现在这个背景下还是之前客户考虑结构化数据和交易数据,客户怎么保护的?像我们人类进化一样,早期客户使用磁带磁盘这些技术,现在用一些去重、快照、镜像,现在数据量越来越大,客户对价值速度越来越高的时候,这时候需要引入新技术,包括数据去重、快照、镜像等等。目前这些技术应用有什么问题?相对来讲比较混乱,很多客户就是像跟我们中国现状一样,发现多个版本多个时代的技术共存就像往前跑的轿车,捷达这种汽车中国十几位的销售量,国外十几年就更代了。很多企业在用磁带,还有一些新企业使用VTL,包括去重,快照、镜像的技术。这么大的成本中心怎么降低运维的成本,如果你太多复杂的应用,复杂硬件各种设备混在数据中心里面,管理问题是非常大的挑战。每年对不同设备进行扩容,包括去维护等等,这些成本的问题。
如何简化传统数据管理带来的一些问题,今天我们介绍一款今年2月份10.0里面发布一个非常好的技术我们叫做onepass,什么概念就是传统的数据保护技术需要多个流程,你做备份需要做检索,搜索哪些数据我要做备份,做数据拷贝、移动后期生成索引,所有这些部分都会以后造成影响。经过我们IDC的分析,非结构化数据的增长远大于结构化数据,非结构化数据怎么管理?很多时候需要引入归档的数据,把历史的数据离线出来放到磁带、微贴、或者存储在云里面做低成本的保存,这会给企业降低IT管理成本,信息化的成本,这样应用多要有流程,这些流程多次重复的操作。很多企业有微中心异构环境,他希望我们有没有视图统一了解,现在汽车很多都有OBD,这个里面状态是不是好的,有没有故障他希望一目了然,并不是希望每个人员去检索,那种效率很低,所以重复的工作非常多对IT生产和服务器压力非常大。今天我要做的事情是我把所有客户关心的数据流程同步化,我一次性数据检索、数据收存,我就清楚哪些我要长期保护,哪些数据离线出来放到我磁带或者云上面,降低我主存储的成本,最终我可以生成存根和报告,让用户很清楚我到底企业有多少数据量这些数据保护功能怎么样,有这样的功能之后对企业来说数据保护才是完整的。
使用onepass使我们数据保护数据分析变得更加容易。我们有一个统计基本上可以结合我们onepass技术帮用户降低90%的成本,把原来窗口降低50%,降低管理负载30%左右。
我传统的方式也可以正常工作,如果你数据达到几百个TB,几个TB这样级别就是要用新技术,onepass可以降低我们操作窗口降低我们成本。
同样一个技术就是虚拟化的,包括很多制造业,高校都在使用虚拟化平台。这些虚拟机越来越多造成什么问题?我听到很多客户跟我抱怨说他们之前买了一个非常大规模的存储,本来计划可以用五年,但是发现上了虚拟化以后这个存储非常快速的被应用了,他们分析哪些是我常用的,哪些建了以后我一个月两个月使用,这种情况在很多企业是普遍的。这个问题怎么解决?今天我们有一个技术也是非常创新的技术,就叫做onepassfor vm。你建几十台虚拟机,建了以后这些虚拟机开着,也没有利用它浪费了资源。我不经常访问的虚拟机,超过一个星期CPU利用率持续低于5%,磁盘I/O的利用率低于10%,这种虚拟机就没有用的,我可以迁移出来挪到别的平台,腾出来的空间我放我的热数据。今天我们解决更上层的管理,你应用怎么部署?你虚拟机如果是冷置、闲置的状态你可以从阵列里面移出来,放到别的平台,这样你成本会降低很多,帮助IT极大化的降低成本。我们很多客户应用到虚拟机生命周期管理的技术,给他带来最大价值是说原来我预计这个存储可以使用5年,他发现用了onepassfor vm可以使用10年甚至更久,反过来如果他预计5年时间,可能一两年就不够了,需要昂贵的扩容成本,这是我们给企业带来的价值,成本降低,可以快速恢复降低TCO。
接下来我们介绍一个比较主要的技术我们叫做关联拷贝,关联拷贝个是我们最近发布非常新的技术。我们看一下IDC的分析,将数据的价值给摘要出来,数据增长很快每年50%以上的增长,真正对企业来说有价值的数据并没有那么多,有价值数据目前IDC给的数据只有30%所有。中国大数据的现状雷声大雨点小,大家都在吼我做大数据,真正做好的小于0.5%。我们现在考虑一个问题大数据如何管理如何保护的问题?我们不可能把几个PB、EB的数据都保护出来,今天我们做什么,我们保护价值数据。有关联拷贝这个数据之前我们看看传统上怎么做的?传统上做数据容灾同时把所有数据一股脑的拷贝走,很多企业建多机房,租用IDC的云中心,他们做的事情把文件所在的硬项拷贝走,你最多是33%有价值数据,但是你现在保护100%的数据,很多数据是垃圾数据你也放到昂贵云中心,磁带库里面占你空间,这是对企业来说不有效的方案,我们有效的管理数据就是建立关联拷贝的技术,我基于你真正存储有价值的数据,比如说我有一个大的文件服务器,有不同时期项目文档,哪些文档最重要,我把这些数据剥离出来放到我们移动中心里面,包括很多IDC都在运营云,有一个空间你可以去租用,亚马逊中国没有落地,我们中国看到华为、电信在落地,落地以后空间租赁按照容量,一个TB多少钱?一个TB标准的价格将近一万块钱租一年的成本,这是一个空间成本。很多企业为了降低数据管理成本降低这种空间。我们做基于内容的拷贝恰恰可以帮助客户节省很多成本。我之前10个TB全部考到云里面,今天我挑对我企业重要的数据放到云里面,那今天我的成本只有1/3或者耿绍的成本,我放少了我网络带宽包括PC都是一个很大的节省。怎么做到这一点?传统软件做不到,今天只有onepassfor vm关联拷贝能做到。我们这里面挑了几个行业应用重点大家分享一下。
第一个是工程公司,大家风风火火的建高铁,高铁里面包括像设计、做研究的,包括很多公司做高铁方案他们有很重要信息是什么?他们的图纸他们的稿件,他希望我有多份存储和拷贝,十年二十年以来我拿出来还可以参考。你文件100个TB我只挑你中间重要的数据离线出来放到我专门的设备里面这样可以降低你的成本我就放你其中最关键数据,这是一个应用特点,或者基于项目,基于格式我们可以挑选出来关键字自动的存放。
第二金融行业,包括金融电信都在做什么?做合规。合规的项目意味着需要对企业相关人员进行审计,尤其是经理主管人员,我公司要上市你所有主管人员每天收发邮件要审计,你处理文档要审计,怎么审计?把这些数据拷贝出来用于后期的人做审计。我们有了关联拷贝,企业只需要对近三年近一年某一些用户数据接收邮件进行独立保存就可以,这样可以大大节省存储成本。
第三面向云服务的使用者我们可以更少的降低云使用成本,因为我只放我最关心的数据。这是我们关联拷贝技术最主要的应用方面。
如果你做一些正常的备份,备份完之后做备份容灾你可能需要非常高的一个成本,这里面有一个估算的方法,正常是绿色的线需要这么多成本存储数据我们例子是三年100个TB的数据放在云里面,红色是使用去重,重复数据删除,这个降低60%到70%的存储成本。今天我们讲的onepassfor vm,我们关联拷贝它实际上比去重更降低成本,因为它只挑选最核心的数据拷贝出来,我们大概不到10%的成本,相对于去重是10%到20%的成本,这样企业IT管理成本,数据管理成本大大降低了。我们这里有一个统计可以节省94%的费用,85%的存储成本,提高90%的处理效益,这是关联拷贝给企业带来的价值,尤其是用于一些大数据的应用成本。
接下来有几个案例跟大家分享一下,其中一个案例是我们在全美最大云服务提供商Rackspace,这个公司在美国运行七个独立的数据中心,大概有五万多个客户在使用,这个比较早的数据现在大概超过6万的数据了,他全球使用onepass的产品,为他云服务客户提供每天备份,这是真正大数据备份场景每天备份量在一个PB,总共备份量超过了50个PB,他用我们去重、关联拷贝的技术。每天运行备份作业差不多七万个,非常大的级别。这个客户使用关联拷贝的技术以后平均备份成功率达到99%,你每天可能有七万个作业在运行,几十个作业可能有点问题,这一点问题可能由于网络原因,你备份设备问题造成的,平均来讲业界做备份,国内的用户,包括全球的用户我们统计平均的成功率是70%左右,我们达到了99%,这是我们帮助客户提供云服务的备份。
中国经过这么多年我们做了两千多家各个行业的客户,这里面包括运营商的客户,也有一些石油石化的客户,还有我们做的金融行业以及政府、制造,这里面其实互联网行业用户也有很多,百度、淘宝、腾讯也在在用Commvault的产品,用了很多年,马上的双12,他们后台运行庞大阿里云的系统那就是通过Commvault的产品做支撑。这是真正到了大数据的规模,我们这个行业拿下了几个大互联网的公司。
最后一点时间给大家简单介绍一下Commvault,Commvault是创新型的企业,公司成立是在1996年我这边拿一组数据来讲,1996年在贝儿实验室内部应用后期我们独立出来作为一个公司运营,我们全球员工超过1900名,我们在做一个数据管理的平台,所以我们是非常专注的公司,这样的公司可能也是全球独家的,只有我们一家公司这么专业做数据管理的软件。1万9000是我们客户的统计,大部分客户分布在全球一千强里面的客户遍布在各个行业。96%远高于客户满意度的情况,平均客户应该在80%左右,我们达到了96%,我们非常关注用户体验。此外IT行业这些年大家都知道很多大公司发展不景气,年底这段时间很多公司有很多裁员很多风波,看看Commvault过去六年时间我们持续增长,每年平均符合增长率超过20%,大概在25%左右,这是为数不多的IT公司可以做到这么高速的增长,类似像威尔等几家公司。纳斯达克上市我们2005年纳斯达克上市,我们全球就一款产品也是自主研发我们市值将近35亿美金。中国我们2005年进入今年运营了八年时间,我们各个行业有很多成功的应用,目前为止在北上广成都我们有自己办事处,北京我们作为分公司独立运营,我们北京设有技术中心和培训中心,面向我们客户,提供一些远场的服务。
我们接下来的这组报告关注公司,Commvault每年对数据管理类的公司在Gartner排名,我们连续三年获得全球排名第一的数据备份公司。我们更多贴近大数据包括云发展的需求有非常多创新和变化。
跟我们友商相比Commvault有什么优秀技术?希望通过这张图大家可以了解一下,像Simpana这些都是最主要数据管理和备份的软件,为什么给Commvault这么高的评价?最主要原子于我们创新设计理念,我们都是一体化的产品,我们只有一款产品可以满足企业在大数据环境下各种各样的需求,数据归档、去重、云备份数据等等我们把所有功能模块集成到底层平台里面,目前这个公司只有Commvault,大家都是通过不断的整合,他们很多技术很难集成在一起,对客户来说运维、采购成本成倍增长,Commvault自始至终维护一个产品就可以了,我们技术相对应用更简单更实用更有创新。这也是业界第三方评估机构给Commvault好评价的原因。
我们前面讲的结构化,增长最快速非结构的数据包括一些应用一些桌面机,对于Commvault来讲我们通过commvauit一体化信息管理平台来做。我们备份功能统一化,无论是云还是虚拟机各种应用我们存在统一的管理平台,这个平台可以做备份分析,可以提供客户数据分析,我们做长期保留有很多不同策略给用户提供各种报告做合规做审计,所有的功能我们集成在这个产品,给面向大数据和云服务的客户提供支撑。
这包括像onepass等等,跟云平台结合我们认证了十几家主流的云平台,包括EDGE、NAS、MAIL、FILE等,主流技术都可以跟Commvault集成进来。这是我的邮件希望大家关注Commvault关注大数据的用户可以随时跟我们联系,希望大家在数据管理这个层面我们多一些交流,我们今天介绍就是这些内容,主要希望大家多了解一下在大数据的环境下有Commvault的公司,我们提供非常先进的技术应用行业各个管理的范畴,谢谢各位。