数据存储产业服务平台

IBM资深系统架构师叶郁辉先生谈虚拟与绿色节能

DoSTOR存储在线 11月29日国内报道:昨天2007IBM虚拟科技大会上,IBM系统科技事业部大中华区资深系统架构师叶郁辉先生深入分析了虚拟技术与绿色节能。本站整理如下:

各位尊敬的来宾,早上好!再次欢迎大家的光临!

今天我们是在IBM的虚拟科技大会上面,但是我接到说要谈一个绿色存储方案的时候,我觉得虚拟跟绿色还是差了一个词,所以我请教我的领导跟同事,想跟大家分享其中一个联系。虚拟是一个科技、是一个手段,绿色是我们的目标。所以,今天我给大家介绍一下,IBM在绿色存储方案方面的一些最新的构造,当然很重要一部分,是虚拟化的技术。

业界看虚拟

我们先看一下整个业界里面怎么看待这个技术的发展。我们刚刚给大家介绍了一下Gartner,上个月最新发布的10大战略性、策略性的IT的技术。这是一个非常新的报告,什么是战略性的IT技术呢?

选出未来三年对企业有重大影响的技术,如果这些技术不采用的话,可能对IT和业务产生潜在的威胁。或者要采用的话,会引起这个企业很重大的投资。如果对这个技术反映非常缓慢,会导致非常大的风险。所以,我们看一下,这10大技术,后面那9大是什么?

大家看到,这里面罗列了9个后面的战略性的IT技术。这里面,大家可能比较熟悉了,比如说第二位的就是统一的通讯手段,这里面包括有可能我们把我们现在的交换的技术,全部统一为IP的技术,也就是VoIP。

或者是第三位的业务流程模块化,它是更加业务性的说法。谈业务层面的,SOA是谈技术层面的。那么这里面也谈到了虚拟化2.0,是一个更新的,更加广泛的虚拟化的技术,也是我们今天大会的主题。但是,这里面卖了一个关子,战略性的IT技术是什么呢?大家看到,是绿色的IT。

"绿色"缘何受宠?

绿色的IT为什么那么重点?我们还是继续参考一下Gartner的观点,他们认为方案设计的重要考量,是耗电和冷却。因为现在全球所有的国家,包括美国这个超级强国,也在不得不面对能源和环境保护的问题。

所以,我们从发展最快的科技行业–信息技术行业里面,这个方案的考量,耗电和冷却必须跟上潮流。包括增加处理核来提高芯片的处理能力,因为我们研究发现如果一个芯片的性能或者是一个处理核的性能,如果下降20%之后,它能节能50%。

也就是说,用50%的能耗来换取20%的性能的提高。所以,可能一个发展方向是说,我们增加芯片的内核的个数,然后把每个内核平均的性能稍微降低一下。又或者说,那个供电和冷却系统,大家可能了解得很多。还有,很好的一些电源管理的技术,不限于我们的移动设备,手机、笔记本电脑,还有我们这些大型的设备,在机房里面的设备。

那另外还有一个是法规遵从。这些法律法规大到国际间的公约《京都议定书》和联合国的宪章,小至我们的标准,比如说有害物质的含量和抛弃物的规定,还有全球能耗跟变暖的相关的法规,还有影响到政府采购的一些规定等等。

所以,这里面是一个法规遵从。以IBM为例,他一直是作为一个企业公民的社会责任来要求自己。所以,其实每一个大的有社会责任感的IT企业都会非常关注这方面的绿色和能耗的内容。

还是有Gartner的调查,究竟什么是数据中心设施方面最大的问题?据调查,CIO目前所面对的问题,不是采购的问题,也不是一个人员开销的问题,最大的问题,是能耗的问题。大家看左下方这个图,黄色的部分是我们服务器采购所支出的一些成本,然后它是以年来统计,还有一个预测。

绿色那部分,是采购了服务器之后,带来的每年能耗的开销。这里面,大家看到我们2007年的话,服务器所带来的能耗的开销,基本上跟服务器的采购的成本是持平的,那么未来几年,这个能耗上升的趋势越来越明显。甚至是远超于我们购买服务器的成本。这里面其实很好理解,因为服务器的性能、性价比是越来越好的。所以,你采购的同样架构的服务器,性价比越好,性能越好的话,它需要的功耗越大。

绿色数据中心主要有5个方面

那么在服务器的支出持平的情况下,它的性能和能耗,是飞速地发展。所以,如果是一个CIO要申请每年的经费的话,其实它相当一部分是放在了供电局跟冷却这些能耗的开销方面。所以,我们看到谈了那么多,怎么能帮我们的用户达成一个绿色数据中心的要求呢?绿色数据中心其实主要有5个方面的角度来看,

第一个是建设。建设的话,我们必须是一个从节能型或者是高效型的数据中心来进行一个规划和建设。然后,是在设备本身,我们实现一个虚拟化,所以我们今天大会里面安排一个讲绿色数据中心的联系也在这里。虚拟化是实现绿色数据中心一个非常非常关键的手段。还有冷却,冷却的技术我们已经发展了几十年,但是我们今天觉得还有很大的提高的余地。那么另外有效地管理跟评估,这也是每一个数据中心管理里面的一个基本的要求。最后,如果有问题发生,或者是说我们进一步地精益求精的话,我们需要很好的诊断的技术,来帮助我们在能耗方面取得更进一步的效率的提高。

所以,我们很多的客户,已经是采用了这5个理念来建设绿色数据中心。然后,实现了包括减低了40%以上的电耗跟冷却的开销。另外,还有服务器跟存储的使用率,平均提高了20%以上。然后,还有现在这个房地产和地皮是很贵的,所以有一些用户甚至是机房的占地面积省掉了80%。

存储设备能耗的增长

我们刚才谈了整个的数据中心,那么数据中心包括很多的设备,作为非常重要的,甚至比服务器还要重要的一个部分,就是存储设备。能耗的增长,目前我们看来还不是太快。

大家看到,这里有几条曲线,是随着我们1992年开始,到2014年,这么20多年的预测跟统计,每年的服务器和存储还有一些刀片、通信设备能耗的开销,我们看到其实最高的那条红色的线,是能耗的大户,就是一些非常密集型的通信设备,比如说交换机和SAN的一些设备等等。

那服务器,放在哪一块呢?服务器基本上是下面第二条曲线,但是它也是一个能耗的大户,所以大家看到绿色这一条,存储是处于一个比较适中的状态。那其实存储设备很大一部分的磁带设备,它是蓝色的,是最底下那一条,其实存储设备的能耗增长和单位能耗的增长是比较节能和绿色的。

但是问题是说,虽然我们单位存储能量所要求的不是太高,但是存储的增长是非常非常快。这里面有一些统计的图表,我们先看左上的,左上是一个数据中心能耗的构成。大家可以看到,这个饼图里面冷却能耗差不多占了一半,冷却是一个电脑中心,那么在冷却方面所要投入的资金是多少?

那另外一块是蓝色的,这是服务器跟存储。所以,我们首先要针对冷却做很好的技术的改进和部署。另外,在存储和服务器本身这个技术或者是一些基础架构方面,要下大力气做很好的文章。

大家看右上这个图,是单位每存储容量的能耗,随着年限的增长,单位存储能耗是越来越低,这也非常容易理解。因为现在每个单品磁盘的容量是越来越大,所以单个磁盘的能耗基本上是恒定的。

但是,大家看左下这个图,我们数据中心外置存储的出货量,是几何级数的增长。刚才我们姜总谈到,其实每年有超过50%到60%的增长,这是非常非常大的增长。所以,两者合起来,单位存储容量的能耗是下降了,但是数据中心所采用的容量是越来越多了。

那总体来说的话,右下这个图说明了,数据中心存储能耗的增长趋势是不容忽视的,也是一步一个脚印往前去增长。所以,这里面的开销,是必须得到很好的控制。

存储环境绿化三大解决方案

所以,我们看到使得存储环境变绿的解决方案,主要有三个方面我们要考量。第一个,更有效地制冷的手段。大家看到,我们是针对这个饼图里面超过50%的份量冷却的方式。另外一个选取更有效率的、能效比更高的存储产品。第三个,是通过虚拟化的技术和一些更新的方案,获得了更高的存储利用率。

第一,有效地制冷的手段。

这里面,我觉得是技术的含量,或者是需要一个公司所投入的力量和资源是一步步往上涨的。所以,我们先看到在冷却系统方面我们是怎么样先投入技术力量。那么在冷却系统方面,其实我们最需要控制机房的热点和利用新的冷却技术。

那么新的冷却技术,包括现在我们重新改进过的水冷的技术,也包括我们通过一些红外的分析,去除机房的热点,进一步地可以带来大概是10度方面的改善。整个机房的空调的效率,可以得到2.5倍的提高。

可能这里面,是一个机房设计方面的问题,但是其实也涉及到了存储设备方面的设计方面新的理念和IBM所带来的新的技术优势。我们具体看了一下,IBM的系统存储里面究竟有什么冷却方面绿色的设计?

大家看到,传统的机房里面,我们都一排排机柜放在里面,那么如果采用我们比较常见的风冷的系统,红色这一块,是一个风的流向,一般每个机柜都是从前面吸冷风进来,然后从后面把这个热风排出去。

但是,这种排风的冷却方式有什么问题呢?如果我们在机房里面一排排罗列这些设备,很容易前面设备的热风,又被后面这台系统的吸风口所吸进来。所以,导致了最后一排设备的冷却效率是大大降低,有可能形成一个热点。

那么我们想一下,从机房的布置来说,我们可不可以这样来理解,把两排设备的出风口给靠近,就是把它转一个180度,这两台设备都从外面吸风,然后背靠背地从他们的背面把热风排出来。

其实这样的设计是挺合理的设计,但是问题是说,我们今天的机房里面,很多的用户都有一个很好的机房管理的条例,基本上是一个大玻璃的房子,平常人是没有什么事情不允许进机房的。所以,我们必须把一些设备的面板都靠着玻璃,让我们比较好的观察。所以,一般来说,我们要进行一个背靠背的设备的放置的话,是需要一定的管理的变更和机房方面设计大的改动。

我们看一下DS8000的设计,已经充分考虑到了这一点,我们是有一个前后散热的模式,本身在单台的设备里面就是前后吸风,从中间排出热风的设计。所以,这里面提高空调的效率是非常明显。然后也能够很直接地降低设备之间的冷却的影响。这里面,是集成了IBM这么多年来一些技术的研究成果,还有我们设计方面最新的技术。

第二,能效比高的存储产品

所以,我们可以看到从设备本身怎么这个能耗?如果大家分析是能耗的大户,就是磁盘设备里面,单个磁盘产生的热量,有一个存储驱动器能耗的柱状图的分析。右边这个图是每个单位存储容量产生的能耗,不同的颜色代表不同容量和不同转数的磁盘驱动器。

所以,大家看到黄色这一块能耗是最低的,那么这种磁盘是什么磁盘呢?目前这种磁盘是7200转/分钟,500G的磁盘。所以,这种通用型的磁盘,我们说在比较适用的情况下,也尽量采用这种磁盘,是向大家推荐的方案。

但是,磁盘还不是最绿色的,因为磁盘还是它在不停地在旋转,产生了热量和能耗。所以,我们可以看到,即便是最绿色的磁盘的能耗,也比不上我们磁带。磁带的设备这里面有一个柱状图,这里面是大家几乎看不到的灰色这部分,是我们的磁带设备。

所以说,我们把磁盘的数据放到磁带上面,单位容量所产生的能耗或者是散热的话呢,我们大概是25:1,就是25倍这么一个差别。所以,我们就看,我们能不能更好地把一些数据进行放置方面的管理。

我们经过了大概10年的总体拥有成本TCO的分析,看到在存储250TB容量的情况下,我们如果单纯采用SATA磁盘和单纯采用磁带设备,所产生的TCO是差别很大的。那么具体的数字是左上面这个表格。

所以我们看到,磁带是非常非常绿的,它大概只会产生1/20到1/25的能耗。但是,我们看到还是磁带跟磁盘两个都不能少,所以最好的方案是我们把磁带跟磁盘通过管理的手段,通过存储的软件,把它智能化地进行一个放置方面的管理。也就是说,不同的设备存储不同价值的数据达到最优化。

所以大家看到,左下方这个图最右边的柱状图,使得它既比单纯采用磁盘的能量开销低很多,同时它也能满足一些高速查找,还有平常的一些在线的数据的管理和访问。所以,我们的磁盘跟磁带,还是看到在一个非常绿色的数据中心里面一个必然的选择。

另外,我们还看到如果单纯设备本身,一定要选择高端的磁盘,那一定要选择同等容量的磁盘,这样比的话,我们做一个横向的比较。大家看到,某个友商的产品举例,能耗的开销还是会低30%。

因为刚刚提到一DS8000有一个前后散热的机制,而且它磁盘的设备还有后台的管理,更加合理。所以,这里面以后我相信大家的很多的采购的方案里面,会要求一个绿色的指标,就是一个能耗还有一个冷却的开销。所以,这几个给的参考是说,在绿色的设备本身的话,我们是怎么去考虑这个方案,然后把这个合理地设备的组合,把它放到一个方案里面去。

第三,技术实现更高的存储利用率

那下一步,如果有了这个设备以后,我们提高它的利用率?平常的话,虚拟化的技术我们也探讨过,如果没有采用虚拟化之前的话,大概一个磁盘的综合利用率,假设40%的话,我们通过采用SVC这种虚拟化的引擎,然后把很多的这些低利用率的厂商把它放到一块,组成一个综合的存储资源池,综合利用率可以增加1倍,达到80%。同时,可以减少很多碎片空间的分配,提高利用率。然后,接着很自然而然地整个系统跟中心机房的开销,会越来越低。

那么这里面,我们这里再回顾一下,刚才谈到的SVC构成的虚拟的磁盘存储方案里面的一个构造。它是通过把不同阵列的存储放到一块,然后在存储池上面划分一些卷,然后在卷上面利用更加先进的拷贝的服务功能。

如果我们要做数据的迁移,比如说从磁盘迁移到高端或者是低端,然后不同性能的磁盘之间的数据的复制等等,我们都可以不中断应用进行一个迁移。还有,它的管理是来得更加方便。

那么虚拟化的技术手段所带来的一个好处,就是瘦供给,那么瘦供给这个概念可能一时不是太好理解。我们看到IBM的移动办公室,这个图是早在10多年前,IBM已经采用了流动办公的做法。

就是说,每一个员工在公司里面,没有一个固定的座位,如果你回到公司的办公室里面,你要坐下来一个座位,首先必须到一个系统里面进行一个登录,把这个位置自己先分配好。

当然总体来说,假设某一个IBM的办公室只有100个员工的IBM分公司,但是这个IBM的办公室大概只会留70个座位给员工。那么这里面,一方面是节省成本、节省地皮、节省办公室租用的租金,但是其实是让我们的员工更好地面对客户,不希望我们的员工每天都坐在办公室里面。

所以,每天至少有30%的员工是跟客户或者是我们的业务伙伴在一块做方案、做维护、做服务和增值方面的咨询。所以,这里面的话,大家看到,100个员工大概只要70个位置就够了。甚至,有的时候可以出现这种情况,大家都跑去见客户了,然后办公室就像这么一个比较空空荡荡的状态。

所以,瘦供给的策略也是一样的,从存储的容量来说,我们并不需要每个应用都需要多少的存储容量,我们就必须物理地分给他。因为每个应用对于存储空间的利用率总是参差不齐。

但是,从每个企业的不同应用和数据库的需求来说,他是有一定的利用率。总体来说,我们这个利用率把它提高到80%、90%是非常高的,如果是20%、30%是比较低的。所以,如果没有存储虚拟化之前,我们要按照应用来分配存储空间是很浪费空间的,因为每个应用都需要分配很多个预留的空间给它。

但是,经过了存储虚拟化以后,我们可以把企业的资源进行统一的、综合的分析和管理。使得我们存储的利用率,可以从整体的角度把握。这里面举个例子,如果我们有100台服务器,每台要1个T,以前是要100个T的预留的空间,那如果采用虚拟和化的话,我们只要30T的空间就可以了。这里面,也意味着有70%的节能。

那利用虚拟化实现瘦供给,我们可以通过几个手段实现。一个是在存储阵列里面实现。那么存储阵列里面实现,包括IBM的N series存储系统,这种N series的功能可以把不同的功能整合起来用。

强大的兼容性

那么IBM的存储阵列里面实现,在整个的业界也是非常领先的,效率也是非常高的。但是,如果有一些用户说,我这里面还有别的厂家的磁盘阵列,那不一定是能够提供这种功能,怎么办呢?

我们可以通过SAN里面来实现。就是你采用在SAN里面的存储区域网,加入IBM的SVC的虚拟引擎。然后把不同厂商之间的存储整合起来,所以就可以实现自动的资源的供给。

另外,在磁盘系统方面,我们还有最新在上个月系统发布的磁盘快照的功能,这已经不是太新鲜的事情,因为在10多年前IBM业提供这种功能。

但是,现在没有多少厂家,能够做到这个功能里面是可以节省空间的。因为,按照传统的功能来说的话,左边有一个图,假设我们测试的数据要两份,要从生产数据里面快速拷贝出两份数据给测试用,还需要另外一份数据给开发用,接着还需要一份数据给QA用,我们需要4份数据。

那么这4份数据在别的实施方案里面是需要预留同样足够的空间做数据的拷贝。所以,拷一个T的数据,我们需要4个T另外的空间。如果我们采用了Space Efficient Copy这种功能之后的话,我们就不需要预留这么多的数量了。只需要实际拷贝的内容,只是更改的内容,所以更改的内容,就是在生产里面更改的内容,大家看到可能只是几十K,所以我们总体来说,给预留的空间,如果按照几十K,大概就是100多K,就可以解决两份测试,一份开发及一份QA容量的要求。

那么这里面,它采用了就是我们在存储系统里面最新的软件的功能。如果大家以后要采用IBMDS8000的数据,千万不要忘记配置这个Space Efficient Copy功能。

软件配合硬件实现存储管理自动化

刚才谈到了一些存储设备本身,或者是磁盘、磁带的基础架构。那么基础架构之外还需要一些软件的配合,才能够更好地发挥我们IBM整体解决方案的优势。这里面涉及到了信息生命周期管理,那我们谈了很多年,也有很多的客户采用了这种策略,这种策略是通过不同数据的要求,把数据自动化地迁移到最佳成本效益的存储。包括磁盘、磁带、光盘,还有磁带分在线跟离线等等。

那么进一步地,我们还需要从另外一个角度考量,怎么通过自动化的管理,把它放到一个能源效益也是同样好的存储设备里面去。

那这里面IBM的方案里面就提供了DFSMS,也包括一个打包的整体方案叫做D2550的方案,还有我们的实施服务。所以,我们进一步地细化的话,这个IOM里面,怎么样能够实现我们的通过管理工具把管理效率提高呢?举一个例子,我们可以识别和清除这些重复的数据。

大家平常可能都用邮件系统,大家可能有感觉,如果有一个附件是很大的,一个PPT是几兆的话,那么这个人发过来,你再转发去拷贝给一些人,这些人要回答你,那么你的邮箱最后是充满了好几兆的PPT。

那么通过我们的自动化的管理工具,比如说归档工具,它会自动识别PPT是同一份文件,他会把这些PPT进行归档,只保留一份,同时你需要的话,再帮你进行一个压缩。所以,你的数据库的容量就得到了有效地控制。

同时,你可以触发一个自动化的流程,回收这些存储空间。这是一个个人系统的举例,其实在企业级的存储里面我们有更好的方案,就是TPC这个工具。它能够帮助大家在企业级的范围里面,进行一个文件的自动化的重复文件的识别跟删除。

刚才谈到了IBM经典数据的产品有TBC,有Tivoli的Storage Management还有A-SIS,也包括了我们谈到了虚拟磁带的设备,把这些数据进一步放到一个非常绿色的虚拟磁带上面去,达成一个经典数据的目的。然后,把这些文件在合适的地点和合适的时间被访问、储存,直到它最后被删除和处理。

虚拟化简化数据迁移

虽然我们看到这里面还有一个更加优秀的功能,是说我们把这些数据放到设备上面去,但是这些设备的利用率是动态的,这个数据的价值也是动态的,我们在不同的设备之间迁移设备,达到一个绿色数据中心,我们怎么样更有效率做这个事情?传统如果没有引入虚拟化,我们从磁盘之间迁移数据,通常是4步。

第一步是把应用停下来,然后第二步是迁移这个数据,第三步是重新连接主机跟存储数据,因为你的数据变更了,你原来访问数据的连线要指向新的数据。最后,才进行应用的重启。所以,这些步骤是非常复杂的,现在我们的大型数据中心都有每年宕机数的考量,这种应用停止的话,尤为显得是影响大。

所以,我们进行了存储虚拟化以后,我们一步就做成了,根本不需要停应用,只是你通过虚拟化里面,给一个指令说移动一个数据。

我记得在2年前,也在北京,也是一个从我们高端的DS8000的磁盘的数据,转移到一个低端的DS4000的磁盘,上面有一个动画的电影,也是我们IBM一个产品的广告。在整个的数迁移的过程里面,这个广告的短片一直在放,前端的用户根本感觉不到,原来这个文件已经从一个物理的磁盘设备,转移到另外一台物理的磁盘设备上面去。这是对于有效地管理和节能是一个很好的手段。

所以,我们做一个总结,其实绿色存储的策略有几个。我们刚才谈了用更低能耗的设备,比如说我们用能源效率更好的设备,或者是用磁带,或者是说我们用同跟冷却设计更好的DS8000高端的磁感系统。

另外,从设备的利用率,我们是通过有效地虚拟化的手段有效地提高,通过企业的手段让他更少的物理设备实现更多的存储服务。达到一个瘦供给。还有像瘦供给的服务,都可以利用瘦供给达到更多的服务。还有我们的数据分层次的生命周期的转移。我们需要达成绿色数据中心进行迁移的过程当中,不影响虚拟化的技术,帮助大家达到既是绿色,也是高可用性的。

绿色创新计划入围IBM十大金点子

所以,IBM投入了每年10亿美金,包括诺贝尔奖的专家也在研究。去年我们IBM几十万的员工,有一个头脑风暴内部的活动,全球四十万的员工提供一个点子,说我们公司应该创新的方向往哪里走。

所以,绿色创新计划我记得在IBM金点子的工程里面,是十大金点子之一。所以,IBM保证每年有10亿美元放到里面。直接的后果是IBM有很多的奖项获得,包括很多金制的奖章。所以这里面,金制的奖章,如果谈颜色,金色加上IBM原来的蓝色,就变成了绿色。绿色可以帮助用户更好地进行一个数据中心的管理,也进行一个作为企业公民所应该有的责任的实践。

接下来如果大家需要刚才我们谈到的绿色数据中心,绿色存储方案里面,还需要一句话来总结我们今天的话题的话,其实就是"最绿的存储,我们认为是来自于最佳利用的存储",因为存储的数据浪潮是不可抵挡的,我们想控制数据量是不可能的。

但是,我们能够做的,是我们利用我们很好的技术,包括硬件、软件和服务,包括我们很好的一些产品的设计,尽量把存储提高利用率,所以就达成了一个绿色的存储。

今天我的介绍就到这里,谢谢大家!

未经允许不得转载:存储在线-存储专业媒体 » IBM资深系统架构师叶郁辉先生谈虚拟与绿色节能