数据存储产业服务平台

[宽频]CSF2007:CommVault的一体化信息管理

时间:2007年12月13日

嘉宾:美国慷孚系统公司中国区总经理 徐永兴

人物简介

徐永兴,现任美国慷孚系统公司(CommVault Systems Inc.) 中国区总经理。2005年11月加入CommVault。

在加入CommVault以前,他曾在Veritas/Symantec公司担任中国区总经理。在其六年任期内,Veritas迅速成长为中国存储业界的领头羊。

1993年至1999年,徐永兴在DEC/Compaq公司任职。他的职业生涯最早开始于长江集团上海计算机技术服务公司。

徐永兴于1991年毕业于上海交通大学,获得计算机应用专业的硕士学位。

直播实录:

大家早上好,首先感谢存储在线搭建这么一个舞台,为各个存储厂商畅谈绿色存储的一个理念。

刚才看到今天很多的世界知名的一些企业厂商,阐述了怎么样在IT的行业,存储的行业可以做到绿色,那么今天我代表CommVault公司参加这样一个论坛。我给大家解说一下CommVault以及我们所谓的倡导的一体化信息管理的理念。

主要包括三个内容,公司的简单介绍,我们专注于对存储当中存放的这些数据怎么样进行管理,所以说我会简单分析一下今天在数据管理方面面临的一些问题,以及CommVault的一些解决方案。

CommVault公司是一家软件公司,我们没有任何的硬件,我们没有任何做任何的存储阵列,控制器等等,我们不做,我们是专注于做数据的管理。今天可以说世界上唯一的一家独立软件公司,专注于做数据管理的。

CommVault公司我们很早在数据方面进行研究,最早的是专注于为AT&T内部进行数据管理,帮助它的内部的系统怎么样进行数据的备份、保护,归档等等。

在 1996年AT&T拆分的时候我们独立出来,对于我们原来所有的架构进行重新设计,我们97年时候看到IT有翻天覆地的变化,当时设计的时候可能一排就是几十兆,但是我们98年的时候对整个架构进行重新设计,到2000年推出第一的产品,今天为止我们是第三代数据管理公司的软件。

CommVault公司在去年9月份纳斯达克上市。从2000年推出这个产品之后,一直在市场倡导所谓的统一数据管理,今天我们来说是一体化信息管理。

今天是世界上唯一的一个厂家能够有单个产品来实现对数据保护、归档,复制,数据查找等等方面的一些数据的一体化的管理。那么实际上CommVault公司今天在从事的所谓的领域是数据管理的领域,还是在IT界快速发展的领域。

那么根据去年9月份做的统计,2006年-10年的数据管理的市场,会平均有8.6%的增长,对应于其他的行业来说,还是一个比较快速的一个增长。

但是CommVault公司我们一直过去以来,在过去的六年我们一直于4倍的速度在市场增长。我们大大超过市场的增长率,我们在不断从我们的竞争对手,我们的竞争友商当中不断发展。

同时我们的全球的用户不断增长,在今年1月份的时候这个论坛我们有幸作为赞助商参加这样的活动,当时我们的胶片是说我们在全球差不多有五千的用户,现在一年不到的用户我们整个用户增长很快。由于数据管理在欧美的市场相对来说是比较长的一个解决方案。

那么我们在欧美的所有的客户都是通过替换我们竞争对手的产品,而进入这些客户的。比如说像诺基亚等等,全球所有的非常大的企业,采用CommVault的产品之前,都已经有很多其他的产品在使用了。他们陆陆续续开始用CommVault。

为什么CommVault以市场平均速度的4倍以上的速度在增长,为什么有那么多客户抛弃以前在解决方案当中的投入,可能大家没有听到的这个CommVault的公司的产品。主要的原因是我们专注于帮助我们的企业我们的客户解决在数据管理方面的问题。

下面我跟大家分享一下实际上我相信在座的很多的IT的专家,计算机的专家这些方面比较了解,我跟大家分享一下我们日常当中对数据管理方面碰到的一些问题,首先来说今天的这个数据增长是可以说爆炸性的增长,我看到一个IDC在今年6月份的报告说2006年全球多少数据产生,2006年总共有1610亿个GB的数据产生,这个数据是多少呢,相当于有史以来所有的文字记载。就是文字的数据量的300万倍。

在一年当中可以产生这么多数据,预计到2010天这个数据会达到9880亿GB,整个数据量以6倍的数据量增长。

所以数据的增长的信息爆炸式的增长,我相信在座的各位可以感受到。所以这么快速地增长,对于传统的数据管理带来很大的一个压力。

今天的IT架构比以前可能更复杂了,可能五年前很少人会提到什么虚拟存储,没有人会说在一个计算机系统里面放很多虚拟机,今天我怎么解决虚拟机里面的数据进行管理,今天有很多新的技术出来,IT存储等等很多新的概念出来,所以今天的IT的架构跟很多年前是不一样的,是更为复杂的。

今天我们的话题是绿色,可能我们今天的IT系统的智能存在问题的,五年前没有人考虑,有人说明年全球可能差不多50%的IT中心,在能源的供给跟智能方面会有问题,刚才其他的IBM的厂商都在说怎么样改善,都是今天IT碰到的很大的挑战。

现在越来越多的法律法规对IT有很多的要求,可能中国这个方面相对来说可能有一些滞后,全球来说针对IT的法律法规超过2万个。

但是今天来说IT的这个系统怎么样满足法律法规的要求,可能是一个非常大的挑战。就在这周CommVault在全球我们发布了一个报告,针对于美国在2005年12月1日修正的一个叫做民事诉讼FRCP,08法规一个修正版,我们调查了很多的公司他们的IT的一些主管,只有20%的IT主管听说过FRCP对IT的要求,其中有6%的人知道有相应的措施可以确保万一诉讼发生的时候,这个IT的系统可以及时提供足够的证据,上法庭也好,打官司也好。

所以今天来说随着这些存储、数据量的来源越来越大,今天的数据中心,今天的IT的人员面临非常大的压力。但是从另外一个方面,今天来说所有的大部分的企业或者是IT的人员怎么看待这个数据呢,所有的人看待数据虽然大家知道这个数据非常重要的,数据是企业的一个发展的根本。

今天看待数据从应用的角度看待,如果电信企业来说要搞一个计费系统,这个计费的数据管理,所以从应用的角度来看。我今天上SAT的数据怎么管理,从应用的角度看数据,不是从数据的本身管理数据,随着数据的快速增长,随着由于法律法规或者公司的规章要求我把这些数据放的时间更久,以备打官司用。可能刚才来说绿色地问题,一天要存放这么多数据,管理好这么多数据,今天从物理上面,从数据中心本身来说,允许增加这些设备的能够是在下降的,而传统的一些技术对这些方面的问题,解决这些问题的能力逐渐下降。

我们看看传统的技术怎么做的,我相信今天99.9%中国的企业在对这些数据进行管理的时候,完全采用一种相互隔离的方式,如果今天说要搞计费,建立一个计费系统,那么这个计费系统很重要,所以需要保护,我对计费系统做了一个保护。

明天说ERP很重要,所以对ERP系统搞了一个备份系统,邮件系统很重要,邮件要做备份,相互之间没有相互独立的,今天由于萨班斯法案,要对邮件系统进行归档,专门上的一个归档的系统。

比如说今天很多的客户要求查询历史话单,那么计费系统里面的话单专门做归档,所以相互之间的数据管理的方式相互独立的,没有关系的,带来很多的问题就是说我有非常多的存储资源完全是为了解决单个的应用而设立的,而相互之间的这些资源没有办法共享的,所以可以看到存储的设备的利用率是非常低的,使用起来也不是很合理。

可能某一些不是很关键的应用,不是很关键的数据占用非常昂贵的设备,所以说使用的方面不是很合理。有大量的数据是重复的。今天来说文件系统的文件,跟邮件系统的数据可能很多是重复的。

相同的数据是被反复地保存,而且随着保留时间的越来越长,你可以发现同一个文件,今天我发一个邮件,发给在座的一千人,保留了一千次,由于法规遵循,要保留三个月,每个礼拜对所有的邮件进行一个全备份,三个月就是13个礼拜,一千份备份变成1万3千份,数据之间重复保存,数据之间无法相互共享,要重新使用、或者重新查找这些数据的时候,需要大量的人工干预,带来的后果成本非常高,不是很绿色,因为占用很多浪费的资源,效率非常低。

同时今天来说要真正使用这些数据的使用者,理论上没有办法访问这些数据的,假设今天说公司的文件、邮件系统得到一个很好的保护,我每天对这个系统有保护。

今天比如说有一个很重要的文件不想删除,我知道这个邮件可以存放什么地方,今天的做法会打一个电话,给邮件管理员,或者系统管理员,我说麻烦你把这个邮件帮我找出来,他会看你要的邮件是什么时候的,才能知道这个时候我的备份的数据放在哪个地方,哪个磁带,然后把那些磁带装进来,然后倒出来,倒的时候要把整个全部的数据倒出来,虽然只找一个邮件,可能要把当初备份的整个公司的邮箱全部倒出来,然后找到你的邮件,然后放到你的邮箱里面,然后单位通知你可以使用。

所以今天来说,大部分人都是这样的,95%以上的客户都是这样的,如果依赖于IT的人员帮助你找到你丢失的文件的话,找到公司的历史档案,可能这些档案全部存在资料上面,可是知道当初写过一个方案,但是这个方案可能三年前写的,已经在系统里面没有了,今天在磁带里面打单位就可以过去。

所以这些都是今天我们IT面对这么复杂的数据碰到的一些问题。那么有没有一些更好的办法,那么这些更好的办法就有点大家说的虚拟化的。

今天大家可以说服务器可以虚拟化,存储可以虚拟化,能不能对应用产生的所有的数据进行统一管理,如果今天我们不对单个应用做单独的备份的话,我对整个企业的数据进行管理,我能不能对它进行数据备份的统一,把这么多的备份系统能够综合成一个进行备份,当然里面可以有一些统一的备份策略,可以把邮件里面很多重复的数据进行删除,统一放在一个架构里面去,能不能这样做。

备份只是数据管理的一块,今天来说为了数据进行管理,除了数据以外,我对文件系统进行归档,我的公司运营的历史数据要存档,我的这些邮件系统由于法规遵循,由于很多原因需要归档,我要考虑数据的安全,考虑容灾要把数据进行复制,能不能把这些数据管理的手段统一起来,因为他们做得事情都是针对你非常重要的数据进行管理,可能是对它拷贝一份,做一个副本,备份的话可能放在磁带方面,复制的话可能放在另外一个地方,归档的话只是做内容检索,能不能进行统一。

如果可以把整个数据管理进行统一管理,可能能够帮助大家解决好这么复杂的数据进行管理。当然也可以通过统一的管理策略,可以把这个数据放在存储多久,多了多久拷在另外一个地方,统一的进行管理。

相互之间的数据可以通过数据删除,通过进行筛选可以使得重复数据留一份就可以,没有必要留一万三千份,当然所有的管理手段可以共享一个单一的存储的架构,所以说如果可以作为做得话的,我们可以做到存储资源的百分之百共享,可以实现信息的生命周期。

可以把很少用的数据放在磁带上面,可以把用的非常少,一定要保留下来的话,可以从磁带上面拿出来放到仓库里面去。

由于容易数据的删除,可以减少对资源的使用。当备份以后的数据和归档的数据很多的拷贝可以不用再转出来,可以把备份和备份之间,备份和归档之间的数据进行相互的容易删除,所有的管理可以制定一个策略来做,不要人工来做。

这样做的话会不会更好。CommVault就是我们的解决方案,就是为了解决这个问题的。

当然我们如果能够把这些数据统一的放在一个虚拟的数据池当中进行管理的话,我可能也可以改变我们传统的这种方式,我要找某个数据的时候,打电话给数据管理员,今天可能用不到了,因为你所有的数据放在一个地方,今天来说如果一个非常简单的工具能够帮使用者查到这个数据的话,使用者可以直接访问这些数据。

CommVault所谓的一体化信息管理,所谓的数据管理就是可以解决这个问题。我们80年代在这个方面做研究,我们为什么说在98年以后说原来的不要了,重新的开发就是因为看到这样的一个趋势。

今天我们的实现方式,我们通过的所谓的通用技术引擎,能够管理所有的存储。

跟不同种类的存储,无论是阵列,还是带库,还有虚拟带库,可以有一个架构进行统一的管理,这个架构方面提供一系列数据管理的工具,比如说数据的复制,数据的保护,数据的归档,通过管理工具产生的数据统一存放在虚拟的存储池,数据池里面,针对这个虚拟存储池我们开发一些简单的工具。

比如说像搜索引擎,我能够对你的所管理的这些数据通过非常简单的方式能够查出来,给每个使用者可以使用,我们提供一些存储资源的管理工具,可以分析哪个存储上面占用的资源,可以用多少的拷贝,到底重复还是不重复的,可以从而帮助你更好地调整数据管理的策略。

具体来说,可能有很多的计算机里面产生很多的数据,通过我们复制的技术,通过我们数据保护的模块还有归档的模块,可以通过一个统一的存储策略,可以把产生的数据、副本放在一个虚拟的存储里面,而且存储的数据完全是一个单事例存储的拷贝,无论你做备份,还是归档我们对它进行一个统一的管理,是一个统一的策略。

如果这个数据已经保护好了,归档好的,有的数据放在磁盘上面,磁带方面,有的可能放在内容的设备上面,我今天如果查找数据,如果不在这些数据上面怎么办,CommVault提供了一体化的内容寻址,内容检索的体制,如果今天我的备份数据,归档数据,要对它进行内容检索,我们可以通这么一个策略,把里面备份出去的数据归纳内容的索引,然后用户可以通过内容索引用搜索引擎的机制可以查找到你要的东西。

我们可以通这么一个策略,把里面备份出去的数据归纳内容的索引,然后用户可以通过内容索引用搜索引擎的机制可以查找到你要的东西。

假设我们某一个企业,或者是做航天的,今天中国航天发展非常迅猛,如果大家通过CommVault的一体化信息管理进行管理的话,实际上在航天的设计院里面设计的中国航天跟载人飞行,或者说嫦娥一号这样一些项目的话,可能很早已经就开始了。

就是发现当初很多的数据放文件里面,还是放邮件里面,还是放其他的地方,今天的数据可能散落很多地方,如果当初通过CommVault的数据管理进行管理的话,今天你非常简单地只要在搜索引擎当中打出几个关健词,可以从备份的数据里面。

还是从归档的数据里面可以找到你所需要的东西,可以找出来。然后可以根据你的需求,把它分类,如果有必要的话,我可以把它输出到一些文件,或者被一些国外的甚至包括中国的企业涉及到一些诉讼,或者某些关键词的话,我可以通过查找这些关键词,把涉及的邮件文件所有的数据可以找出来,可以很简单地做一个法律封存。

大家都知道备份数据有保留周期的,可能我的企业是保留三个月,可能三个月以后这个磁带会被洗掉了,但是今天如果发现我马上要被洗掉的磁带里面有一些数据跟我的案件有关系的,可以通过法律封存的条件,可以把这个锁住,可以帮助我们的企业很好地找到你应对法规方面的所需要的这些数据。

当然也可以把某一些你查找的这些关键词做一个策略。比如说一些企业从事的一些研究可能跟保密有关的,比如说生产某一个材料,研发某一个材料,这个材料是保密的,或者说企业是跨国企业,今天很多人通过邮件或者文件的时候,会有意无意涉及到这样一个东西,可能我们IT的人员不可能知道这个计算机里面的文件。

或者今天发的邮件里面涉及到很敏感的信息,CommVault可以帮助解决这个问题。

如果一旦你今天发了一个邮件,这个邮件里面的数据涉及到敏感的问题,你今天只要通过CommVault的解决方案进行一次备份,我们就可以知道你的这个邮件里面包括保密的东西,因为我把敏感的东西作为一个关键词搜索,我们搜索到你这么一个邮件以后,可以通知相关的部门能够追踪说这个邮件今天已经到什么地方了。

或者这个邮件扩散到什么地方,可以通过你的搜索的数据能够变成你公司管理这些信息的一个策略进行管理。

那么我们使用者可以非常简单地使用这个数据,通过一个搜索引擎,可以给我们使用者提供的一个界面。里面有一个用户的权限控制非常重要的,不能由于这个工具以后,可以搜索到我的老板发的邮件,这是不行的。

搜索的方式我相信在座的方式都可以用,跟百度,Google一样关键词的方式可以做到。搜索的速度非常快,这个例子0.1秒的速度找到33条相关数据。

今天来说CommVault是唯一一个厂家可以提供在线直接访问数据的,只有CommVault可以搜索到存储里面的在线数据,是在带库还有虚拟带库的数据,还是说这个数据已经放在仓库里面都可以通过搜索引擎找到这个数据在哪里。

刚才是找到这个数据,同时可以直接访问这个数据,你可以直接按打开,可以把相应的数据直接展现给人家。跟刚才举的例子完全不一样。今天传统的来讲,这个邮件的例子,在你系统删除的话,你打电话给IT的人员让他恢复的话,今天可以自动搜索可以把磁带的数据倒进来,放到邮件里面用。

CommVault作为一个全球唯一的一个企业级的数据管理的独立软件开发商,我们对数据管理方面有非常多的研究历史,我们关注今天当中最重要的资产之一就是数据,怎么样让这些数据可以进行很好地管理,那么管理地目的我相信是两个。

一个是这么重要的数据怎么能够保全好,保护好,另外一个就是当我需要的时候,怎么能够把它很快地找到,而且可以展现在你的面前。

今天CommVault的一体化信息管理,是最好的解决方案,那么我相信刚才说的大家对CommVault不是很了解,我们今天有更多的机会能够了解CommVault。

我们在外面有一个展台,大家如果有兴趣的话大家可以看一下,我们有一些演示。我们下午还有一个讲座,如果大家有兴趣的话可以参加。谢谢大家!

未经允许不得转载:存储在线-存储专业媒体 » [宽频]CSF2007:CommVault的一体化信息管理