2014年12月2日,由中国软件行业协会、中国计算机学会、武汉国家光电实验室和国防科技大学大力支持,DOIT传媒和存储在线联合主办的中国数据存储年度盛会—— 2014(第十届)中国存储峰会今天在北京盛大开幕。作为中国存储产业的十年盛会,峰会以“掌控数据经济·重塑商业价值”为主题,邀请超过1500位学术界顶级学者、产业精英和企业用户出席,围绕数据经济和商业价值两大话题,从云计算、大数据、软件定义和闪存等四个技术方面举行一系列主题演讲和圆桌会议。
在下午的闪存分论坛上,EMC大中华区ExtremIO业务经理 韩冰发表了题为《持续领先-EMC XtremIO全闪存产品及解决方案》的主题演讲。以下是文字实录:
韩冰:大家好,我叫韩冰,我是在EMC大中华区负责EMC XtremlO产品的经理,业务经理。
我加入EMC时间也不长,之前我也在别的公司工作过。到目前为止我觉得凭我个人的以前的知识结构和我的理解,我对这个产品非常非常的喜欢。今天因为我们也是最后了,可以轻松一点,我尽量会分享一些我个人对产品的理解和想法,希望能够给大家一些启发。首先我为什么喜欢这个产品呢?因为它市场表现非常好,这个产品到目前为止我们才发布了一年左右,我们最新的销售额的统计,关于这个产品我们在今年应该是Q3的,我们的年化的销售额已经达到了5亿美金,在全球已经达到5亿美金。大家对这个行业比较熟悉,知道在这个行业有一个约定俗成的门槛,如果一个产品,一个商业的盘子如果达到10亿美元,说明这个市场是大家都会认可的。我们这个产品刚刚发布了一年,在市场上取得了这样的成就,我们自己也是非常意外的。而且这个产品不仅仅是增长最快的一个产品,在整个EMC历史上所有的产品里,这个产品的增长速度是前所未有的。在这个产品发布半年之后我们就已经取得了市场上全闪存阵列的市场份额的第一位,大家可以看IDC11月25号发布的一个市场报告,关于上半年的,所以我们是名副其实的领先的。
那我们在两个方面都得到Gartner的很好的评价,前一段时间有友商发布魔力象限。大家可以注意在这个魔力幻方里有两个纬度,一个是产品的理念,对未来的技术发展的前瞻性的理解。另外一个纬度是以市场各方面的执行能力,我觉得一个是想得怎么样,另外一个纬度是实现得怎么样,我们知道有些人可能比较善于思考,思想上有非常好的理念,但是他输于实践。有些实践能力比较强,但是没有特别好的视角,特别好的这种理念。而在这个市场上如果你是领导定位,那你在理论和实践都必须做得非常好,而我们EMC的EMC XtremlO产品,这两个纬度都是目前市场的领导者,所以我们在领导者象限。
接下来我可能分享一些我们EMC对全闪存阵列在市场上表现的一些理解,我先给大家看一个完整的。首先我们认为客户对于全闪存阵列,或者对于闪存的接受是有一个过程的。随着他对闪存介质的不断的接受和认可,和产品的不断的发展与成熟。它在客户的数据中心里应用的比例会逐渐的增加,而这种演变的过程我们认为可以分成三个阶段,第一个阶段就开始于2008年,为什么2008年是一个时间节点?主要是因为在这个年度的时候,以EMC为代表的高端的企业级的供应商都在自己的设备里开始部署闪存介质,这个是我们今天说的混合阵列。比如从高端到中端到低端都有多种磁盘介质可以选择。以2008年为起始,那我们说的第一个阶段客户关注的是什么?是关注闪存的介质作为性能加速器对应用程序的一些好处,主要是用来做性能加速,在这样的阶段闪存是怎么用的?基本有三种用法,第一种用法就是前面讲的分级的存储,传统的全闪存阵列作为二级使用增加命中率。第二种用法是把闪存介质,是以HBA卡的形式出现,插在服务器里面,也是做IOPS加速用的,这两种都不是独立使用的,都是作为加速。
第三种有一些全闪存阵列出现,但是这种全闪存阵列因为本身专注的是提供闪存的性能,就是亚毫秒级的响应时间,但是缺少数据服务。所以这样的设备一般我们会建议设备(英文)原有的磁盘存储环境。这样的好处是它可以被共享,但是它仍然不能独立的取代磁盘阵列,它是融合进原来的环境,因为它本身没有任何的服务,像快照等等这些服务没有,没有单位单独作为一个(英文)的主存储来使用,这是第一个阶段。到第二个阶段闪存开始在数据中心里面独立的为应用程序提供服务,换句话说就是一个数据库可能就装在一套全闪存阵列上面就可以了,不需要融合进一个传统的存储环境,是这样的用法。这样的用法势必会要求你全闪存阵列具有一定的数据服务能力,像我前面讲的快照满足客户的时间窗的要求,或者持续的数据保护的能力等等,就不举例子了。
但在这个阶段闪存可以独立的使用,第三个阶段是什么阶段?闪存开始扮演它另外的我认为更重要的角色,它帮助我们做应用程序实例的整合。就是说一个闪存设备同时服务于多个,我觉得这将是闪存未来更有前景的应用场景。我个人觉得全闪存阵列的介质的出现,作为一个独立的存储设备或者平台的出现,它的意义对整个应用系统或者客户应用环境的影响力足以跟什么相比?足以跟现在的所谓的信息高速公路,高速互联网相比。在我上大学的那个年代,上个世纪90年代中期,那个时候你要在家里拨号就已经挺不错的了,50K的,就已经很不错了。那时候互联网用来干什么?基本就是两个事,就是浏览一些外部的网页,因为网络带宽就限制了你。当后来的拨号网络,或者网络进入到光纤时代,甚至现在的桌面的宽带都是20M或者百M的款待,难道你还会单纯看网页吗?现在更常使用视频点播或者音乐下载,随着网络速度的提升会带来一些新的应用的形态出来,这个是在以前的窄带的网络环境下不可能存在的一些东西。我觉得闪存的出现势必会激发一些新的应用使用方法出来,为什么呢?因为大家想一个全闪存阵列现在动不动我们号称提供IOPS就是几十万、上百万,响应时间都是我说它是一百个微妙,他说是两百个微妙等等,都是微妙级别了。这意味着存储再不是性能瓶颈,相反它是被资源浪费非常大的一个组件。现在很容易讲几十万IOPS,但是在客户生长环境里你什么时候看见过IBM那么大的工作负载直接到前端?我们动辄几百万的都是看百分之百命中的指标,说实话跟弹性一点关系没有,真正落到的IOPS可以通过盘的数量乘盘的能力计算出来,那个没有意义。实际在客户上看到的应用程序可以产生10万的IOPS每秒到盘的压力,全国范围都是屈指可数的。意味着单单的一个全闪存阵列服务于一个应用程序有可能资源被浪费的不得了,这个用法可能是以后相对最浪费的,觉得买闪存贵绝对不是不可能的,是两个概念。所以你要想发挥闪存设备全部的性能,必须用它做一个事,就是数据的实例的整合,使每一块数据都可以同时服务于更多的应用程序。而我们想一下,在两个环境下最起码这是非常典型的,一个是虚拟环境,虚拟桌面都可能出现相同的模块,但是被不同的应用使用。另外一个是数据库领域,就是用闪存做数据库实例的整合,充分发挥闪存的性能,不仅仅是因为闪存太贵了,我觉得原因绝不是因为这个。
现在问题来了,一个全闪存阵列想扮演我说的阶段2和阶段3的角色,它想满足这两个阶段的客户的要求。它需要具备哪些能力?这个产品需要怎么设计才能满足这个要求,这是我们要想的。答案当然就是EMC XtremlO就是为阶段2和阶段3设计的。
首先阶段2和阶段3有什么要求?必须是(英文),因为(英文)才是高端蔡楚的主流的价值。其次必须是(英文),因为(英文),这个性能系反馈时间,不是说IOPS,是延时时间。你在扩容的时候。另外一个你必须要有丰富的数据服务,这种数据服务可以帮助我们把一个闪存的很小的一块介质,尽量被更多的用户所使用,就是可以把很多的IO负载集中到一个设备上,充分发挥闪存的性能和价值。
第三现在不是个人英雄时代,必须跟其他产品组成一个完整生态系统。这其实是很重要的一个片子,但是我觉得没有必要讲了,这是讲为什么EMC XtremlO为什么那么重要。市场上主流的存储架构有大概四种模式,第一种就是(英文)这样的,大家在传统的终端存储经常见到这样的架构,这样的架构的特点就是起步低,拓展非常灵活。它的非特点是什么呢?就是它的弱点是什么?我个人觉得很难塞进(英文),如果它支撑它的盘,在5块到500块甚至1000块之间,它的控制器配你的磁盘的最佳数量是什么?你说1000块的肯定是浪费,500块的话到1000块的时候控制器能力就不行了,那必须有取舍,有最佳的部署能力是什么。因为这种架构相对来说比较简单。所以我们看终端存储,或者说终端客户的要求,一般这种架构可以满足,浪费点就浪费点,或者说不够点就不够。但是一个真正的高端的环境,你要包括每一个业务的单独的服务级别的话,靠这种架构肯定不合适,应该靠什么?应该靠EMC XtremlO的产品,才可以充分保证每一个应用做到最佳。
后面还有两种,还有一种互联问用的比较多的,这两种都不太适合(英文)的工作环境。最后EMC XtremlO在不同的架构都有自己的产品,EMC XtremlO这个产品应该采用(英文)的架构才是最佳的选择。于是EMC XtremlO采用仅有的(英文)。每个模块是这样,你的容量不够可以2、4、6往上扩。今年12月份,大概现在支持是6个节点作为最大规模的配制,很快到明年的中旬我们就可以扩到8个节点,每个节点的容量也会有增长,细节不说了。
另外一个就是我们的EMC XtremlO整个的软件结构都是为了缓存结构设计的,所以我们设计的目的就是为了最大程度上发挥每一个闪存单元的存储的性能和效能。所以当每一个数据流过来的时候会怎么样?首先所有的卷都是经过(英文)处理的。然后来了之后我们先对数据进行去同,然后再进行压缩,然后在一定的加密保护下放到存储介质上去。这个基础上还可以做很多快照来对数据进行分享和共享。这里面值得一提的就是我们的快照不占用任何系统,并不产生任何额外消耗,因为我们的形式就是为快照的形式设计的,所以快照的我们不需要考虑预留的变化量的空间,没有任何的额外的性能上的开销,所以我觉得在很大程度改变了大家对快照原有的不好的印象。这里我需要提的就是在(英文)全闪存阵列的架构下,可能客户对原有的(英文)和快照技术的理解我觉得可能都需要重新修整,因为在(英文)环境下,原有的对性能方面的担心,对管理的困难方面的担心都已经完全的被解决了,这里边我们就不展开了,因为这可能会涉及到很多技术上的实现和技术上的具体的一些问题。
我们看这是一个当今非常典型的应用环境,一个数据库实例会被拆成很多份,为什么呢?核心目的是不想让其他的业务分析或者应用开发这些一些应用影响到核心生活卷的级别,不想跑分析的时候这边生产压力大速度慢了,这可能是我不希望看到的,所以我把它拆开。但这实际上造成了很大空间上的浪费,这个很容易理解,因为以前我们是用空间来换时间的。我们把数据拆开了之后换来的是原来生产的服务级别得到保障,响应时间没有拖慢,所以空间来换时间。但是相同的(英文)在闪存环境就会变得非常不合理,因为闪存的性能不再是问题,闪存年代你需要做什么?你应该用闪存的性能来换空间的节省,换句话说我需要做得就是充分发挥闪存的每一个存储单元的能力,尽量的整合整个应用系统里的实例,用一个实例同时服务多个项目,充分发挥闪存性能,用性能和时间来换空间的节省。这个只是我前面讲的闪存时代对于客户应用环境的影响的一个具体的表现的一个形态。
我们觉得真正对闪存最合理的使用方法实际上是你把你的生产数据,经营分析的数据,你的研发的测试用的数据库实例都正和岛全闪存阵列的设备上来,第一个好处就是每一个人的用户体验都是全闪存阵列体验,你的开发环境,你的开发人员得到是全闪存的响应时间,用到的是最新的生产的数据,很容易随时做一个快照出来,你有的就是最新数据,对经营分析也是这样,你导一份数据出来,然后再跑你的作业去分析数据,最起码是一天,甚至是一周以前的数据,现在完全基于分钟或者小时级对最新的业务进行分析,而对生产没有任何影响,这个是对客户来说比较大的一个改变。
我觉得虚拟机环境是另外一个比较典型的应用的一个场景,因为它天生在虚拟机环境下就是有很多相同的实例,我通过全闪存阵列有可能把虚拟机实例整合在一个单独的介质上,使得每一块数据都可以被多个不同的应用程序,做应用程序的整合,所以这是一个天生的一个环境。我个人觉得EMC XtremlO产品在VDI环境是决配,因为VDI环境很特殊,很多客户不喜欢,既花钱,办的事又不漂亮,客户体验也不好,因为每个人都觉得慢,然后维护人员维护起来也觉得不好,所以没有人高兴的一个结果。但是有了EMC XtremlO之后我们有可能把所有问题解决掉,把部署千个桌面变成一个很简单的事情,一个命令放在后台就干了,做起来不止一两千个桌面,可能到后台就就进行完了。而且整个的空间使用效率很低,我们曾经用一个(英文),可能是5个T的,支撑了一个用户大会,整个会议期间可能有上万个虚拟机被建立和被删掉,这是非常复杂的,这个产品独立的支撑下来的,我觉得是一个非常好的案例。
我给大家提个醒,闪存是很快,但它不是永远快,也不是一定快,你可能发现用着用着它就变慢了。有可能比机械硬盘还要慢。闪存是有可能比机械硬盘还要慢的,因为闪存的设计就决定了这一点。如果你不想让它变成那么慢有很多东西需要做。比如你用非常有效的垃圾回收的机制去保证,因为大家知道闪存是这样的,你要写之前必须把原来的数据擦掉,然后写。但是问题是你写的时候是一个配制一个配制的写,问题是你擦的时候不能一个配制一个配制的去擦,你有可能是上百个配制一块擦,擦的时间是GB,写的时候可能是KB,你没有时间擦一整块,那这时候你要做什么?你要做碎片整理,而这个是非常慢的,而且所有的闪存都有这样的问题,那你怎么应对?每个产品有自己的解决方法。我现在觉得EMC的解决方法其实是非常好,这里面也没有太多时间,所以就不介绍产品的细节。我只是告诉大家闪存不一定快,有些人用了闪存,两周前在一次客户交流那,有客户说我用了闪存,但是用了一段时间之后突然出来一个峰,响应时间可能会变成几百个毫秒。当然我们可以很好的解决这个问题,然后我们的产品不存在这样的一些问题。后面的内容我就不详细的解释了,有一些应用案例,我们现在在国内也有一些应用案例,但是时间关系没有时间详细去讲。
但是我相信这一页跟其他的讲闪存的厂商也没有特别大的区别,无非就是缩短了CPU的资源,节约了你的数据库的(英文),但是我要跟大家讲真正的全闪存阵列你要用好,一定要用它来做应用程序实例的整合。这样的话才能充分发挥一个闪存所有的性能和效率,如果你单单跑一个业务,说这个性能特别慢,换一个闪存,你这个是一个解,但并不一定是最佳的解,这里面时间关系就不多说了,谢谢大家!