Oracle肖淑男:善待闪存
[导读]肖淑男谈到:闪存的应用,有做存储,有做内存的,还有做高速缓存的,因为价格的原因需要一种平衡。对SSD的使用不仅仅是替换HDD,善待闪存要做到不滥用,终极目的是做到应用的高效运行,作为全闪存领域的先行者,甲骨文认为“全闪”的实现要包括“闪”的性能、“闪”的部署、“闪”的管理、“闪”的效率和“闪”的连接这六部分。
2015年8月5日,由DOIT传媒和存储在线联合主办的2015中国闪存峰会在北京盛大开幕。本次峰会以“闪存加速数据经济变革——颠覆方式和速度”为主题,超过 500位各行业用户代表,数十位顶级学者、产业精英和技术专家出席,以圆桌讨论和主题演讲等形式,从不同角度深入探讨“闪存加速数据经济变革”这一话题。
在下午的全闪存阵列论坛演讲中,Oracle技术咨询总监 肖淑男发表了题为《善待闪存》的主题演讲,他谈到闪存的应用,有做存储,有做内存的,还有做高速缓存的,因为价格的原因需要一种平衡。对SSD的使用不仅仅是替换HDD,善待闪存要做到不滥用,终极目的是做到应用的高效运行,作为全闪存领域的先行者,甲骨文认为“全闪”的实现要包括“闪”的性能、“闪”的部署、“闪”的管理、“闪”的效率和“闪”的连接这六部分。
以下是文字实录:
肖淑男:我的题目是善待闪存,我相信大家今天从上午到下午这么久大家都在讲闪存,闪存多么多么好,多么应该去用。我来抛一句善待闪存,我是捧场的。
我来自甲骨文公司,全称是Oracle软件系统有限公司,为什么我会出现在存储的会上呢?
我讲两个事实,第一,Oracle收购了SUN,SUN公司是第一家作出光纤通道阵列的厂商,同时当SUN公司做闪存阵列的时候市面上没有闪存阵列。08年全面推出我们第一款全闪存阵列,我们讲闪存最有资格和有底气。
从下到上容量越来越大,成本越来越低,从上到下性能越来越高,容量越来越小。所以其实我们在闪存进入我们市场根本原因是什么?是因为我们的硬盘跟我们的内存性能差距太大。大家看一下硬盘的响应时间是毫秒级,内存的响应时间是纳秒级,中间再加一个闪存,闪存是微秒级。为了平衡他们巨大的鸿沟,我们应用了闪存提升整个系统的性能。
今天这个时代对我们企业来说怎么去选择硬盘或者闪存?大家都在讲闪存什么时候替代硬盘,全面替代硬盘不太现实。两来看,高容量硬盘是高性能闪存的1/30,成本和容量角度考虑,今天闪存是替代不了硬盘。从性能来看,你极致追求你的IOPS性能呢。每个IOPS10个美金,这是0.13个美金,相差80倍左右。你是追求极致性能,你选择闪存不错。今天可能在性能和成本、容量之间做一个平衡,做一个妥协,我们真的不是那么有钱,其实我们那么有钱我们也不应该那么任性,我们还是应该考虑多方面的因素。
今天的技术如果我们闪存的引入仅仅带给我们这样的选择,我们拿 SSD替代HDD它的效果是什么?进IT一定有瓶颈,我们的硬盘在我们整个IT系统当中唯一做机械运动。因为有这个瓶颈存在,我们的IT有瓶颈。全部换成缓存,存储位置不是瓶颈,但是瓶颈会转移,转移到你IO通道,没有得到应该得到的性能。仅仅用硬盘把我们闪存替代,我们系统还是获得我们说期望的性能,还是有瓶颈。
第二个可能就资源的浪费。因为如果你全部换成闪存,不见得能够把全部闪存能力发挥出来。今天我们从上午到下午,大家在讲的术语是什么?IOPS,有谁讲过IOPS能够换算成我应用系统的性能吗?IOPS高,我的应用一定能高吗。如果你做一件事情你需要一万个IOPS,但是我做同样一件事情,我只需要一百万IOPS呢,谁更好?我们盲目追求IOPS没有意义,我们更多追求应用的性能。
接下来我要讲我们怎么善待闪存,怎么善用闪存,第一我们不要浪费。全部用闪存也许好,也许不一定好,所以我们要权衡,我们要去斟酌,真的对我们现实的应用环境做考量。
第二我们根本目的是做到应用的高效运行。唯有应用的高效运行,我的IOPS很低,如果你做同样一件事情,你需要一万个IOPS,我只需要500个或者是 5000个,我的IO性能只要你的一半甚至1/10就够了,甚至更好。怎么样能够应用的高效运行,是对存储和整个IO系统也是一个整体的目标。
Oracle今天讲闪存,讲存储一定有自己的角度,什么角度?我们叫AES。让我们的存储跟我们的应用整合起来之后,直接把我们的存储的性能转换成应用的性能,这个我们的目标就达到了,我们的逻辑非简单。
怎么来做?这个理念下我们做的产品就是FSS,这个产品是我们去年发的产品,是按照全闪存配置做的架构。前面这位戴尔同志说我们很多传统的存储厂商做全闪的时候,存储架构把硬盘换成闪盘,你解决了硬盘的瓶颈问题,但是没有解决你整个存储系统架构的问题。你的处理能力够不够,你的通道够不够,没有答案。所以也许你全换成闪存,他整个系统崩溃了,这是可能。我们这套系统是按全闪存做的系统配置。
总结一下,我想闪字,第一我们要闪的性能,第二我们要闪的部署,闪的管理,闪的效率,闪的连接。
闪的性能,我们FS可以配置成全闪存,有两种闪存,一种是高性能闪存,是SLC,还有一种高容量闪存是EMLC。我不同意前面同志说SLC、EMLC没有区别,可以告诉大家有区别,从性能、可用性上都有区别。他说没有区别,是因为他们没有。不管是读还是写,还有最大的吞吐能力,还有一个最低延时。我们全是闪存,延迟一定很低。
我们可以配置成你用全高性能闪存配置达到2.8TB,高容量闪存配置达到912TB。可以用全闪存均衡配置,平衡你的性能、容量、价格。我们的性能达到多少?50%的读写,我们能达到200万。有没有300万和500万的数字,吞吐率能达到80GB。
闪的部署,对于存储来说,今天我们IT变得如此复杂,有应用和数据库、中间件、操作系统、服务器、有网络、存储等等部署起来非常的复杂。而且我们说过,我们要把存储和应用集成起来,存储是离应用比较远的东西,我们在部署上让它简化。
我们存储上面终究是要部署应用的,每一个应用的数据分布以及他的IO模式都是不一样,你不一样的数据分布可以提供不一样的模式。Oracle用他30多年经验,让他实现自动部署。
你说你要部署数据库,你只要按一个键,系统自动给你部署好了。大家知道数据库当中所有的钱临时文件,他的优先级和对IO要求不一样。只有把这些布置好之后,你的性能直接到我们的应用性能上去。
闪的管理。IT系统变得越来越复杂,需要管理。我们今天遇到这样的困境,当如此复杂的IT系统的时候我们怎么去管理?你有存储、有网络、游服务器、有虚拟化、中间件等等,几乎每个厂商都有自己的管理工具。有的厂商开发平台性的管理工具,两个管理工具都有他的问题。各个厂商管理自己城市的时候,能够深入细致挖掘他的细节,只见树木,不见森林。平台管理软件是高大上,不能精确定位我们的具体问题在哪里,如果你出现性能问题,出现故障问题,他不能深挖下去到细节问题,甚至对于配置进行改变。
Oracle的OEM,他能够从应用、中间件、数据库、服务器以及虚拟化、网络到存储,从应用到磁盘全部都管下来。满足两方面要求,第一综观全局,第二深入细节。同时我们还要把我们的管理进行自动化。刚才我们说到我们既要保住部署快速,还要管理简单。数据库或者应用在运行过程当中,他的数据是会发生变化的。哪些数据有时候是热的,过一段时间会变温,也会变凉。哪些数据放到最快的闪存中去,哪些数据放到硬盘中去,实现自动的部署。
消费者IT和企业IT融合,最大融合点是手机和平板,我们也是顺应潮流。我们把我们存储所有的管理和功能,推到我们的智能设备,支持IOS和安卓。你能随时随地通过点触实现你对存储的管理和监控。
闪的效率,怎么实现我们高的效率。第一我们再一个系统当中用混合存储,既有高性能闪存,也有高容量的闪存。这是成本和容量性能的效率的。第二点我们怎么样能够把应用系统当中优先度最高的数据以及进程能够获得最快的IO响应,这是我们需要提高效率的地方。第三怎么样用更小的磁盘空间存更多的数据,业界最好的压缩技术。第四既然有这么好的压缩技术,怎么样把哪样的数据以什么样的方式压缩,放到什么地方去。不要人工操作,系统自动操作。人工永远分辨不出哪些数据更热,哪些数据更冷,哪些数据经常被查询,哪些数据不再被查询。只有系统才知道,我们说这里有一个ADO,自动数据优化。
一个个简单看一下,为什么我们要用分层技术,我们要用混合的存储,而不是纯闪存。因为大家可以看一下,这个红线的意义是什么?是你百分之百的IO正好均匀的落在你百分之百的存储空间上。这种情景有吗?我相信现实生活当中不会有的,怎么可能。就像中国的土地一样,960万平方公里,13亿人,能够均匀分布在960万平方公里吗,不会均匀的,沙漠一个人没有,北京这么多人。我们实际当中是什么样子?这个绿色的线是Oracle应用的分布,80%的IO落在30%存储的上。如果我们把所有数据都放在闪存当中,一定是一种浪费。我们又需要享受闪存的性能怎么办?要有一个很好的配置,又能够获得闪存的性能,同时又能享受硬盘的成本。
Oracle想了一个办法,把整个系统用四个层次分出来,高性能闪存、大容量闪存,高性能磁盘,大容量磁盘。
大家讲到存储会讲到QoS,哪些热的数据需要快点访问,冷的数据慢点访问。Oracle是看应用,你热的数据不一定是你最高优先级的应用。大家上班的时候,9点上班,最热的数据是邮件系统。最高优先级的应用是什么?肯定不是邮箱,应该是我们领导的报表。就这几个领导,数据一定不热,优先级一定很高。我们这里做的QoS跟别人的不一样,不是热的数据,是热的应用,高优先级的应用先服务。还有这里数据1到10是IO请求到达存储的顺序,颜色不同是优先级的不同。我们说优先级越高,不管什么时候到,都要有优先服务。先到先服务是我们今天所有传统厂商采用的一个策略,这个是不对的。
还有压缩,对于数据库的压缩其实很难的问题、很难的技术。Oracle有很多压缩的技术,高级压缩、基本压缩,又推出一个混合列压缩。你要压缩节省了空间,牺牲了性能。我们要做既能够节省空间,又不牺牲性能怎么办?我们走了另外一条路就是混合列压缩,它能够替我们省多少空间?如果是查询混合列压缩是达到10倍,存储空间极大的节省。我们能够保证性能,为什么?我们是混合列压缩,不是纯列压缩,纯列压缩对写和修改的操作伤害很大。我们压缩比达到这样的时候,我们的IO是减少了。原来一个TB,现在变成1/10的话,100的TB。原来你有10个TB的IO现在有100个TB的IO。
这里又推出一个技术就是 ADO,自动数据优化。他把热的数据往快的闪存上移,把冷的数据往高容量的硬盘上移。这是传统存储厂商都做到的分层存储。我们还进一步做。哪些数据已经冷得几乎不怎么用了,我们给他做混合列压缩,省50倍空间。如果你还要查询,我们用查询的混合列压缩省10倍的空间。
最后一点闪的连接,所有厂商当中几乎都有这个能力。看到所有的操作系统都能和这些虚拟化的技术连接起来。
最后想跟大家分享几个观点,第一企业买存储怎么考察,怎么买。你考虑的最基本的问题一个容量+性能,容量很好算,这么多磁盘,你什么方式保护可以算出来。用哪家技术都是这样的算法,很容易算。性能呢?性能大家都会找这个网站,尽管Oracle的测试不错,我还是给大家一个提示,它跟你的应用还是不一样,你拿这个做你应用的容量规划、性能规划可能会走偏的。Oracle都会强调应用实际的性能和实际的功效是什么样子的。
我们很久以前学过的一篇课文,郑人有欲买履者,先自度其足,而置之其坐。至之市,而忘操之。已得履,谓曰:“吾忘持度!”返归取之。及返,市罢,遂不得履。人曰:“何不试之以足?”曰:“宁信度,无自信也。”
Oracle这句话,高效运行应用才是王道。
最后跟大家分享几句话,第一句话,闪存好,须善待,勿滥用。第二读性能,唯指标,难适用。最后,好存储,不任性,懂应用。存储好不好,应用知道。懂脚的鞋子可能能够让较更舒适,懂应用的存储,才能让应有更高效,谢谢各位。
欲知更多关于2015中国闪存峰会的精彩内容请点击查看闪存峰会全程直播报道专题。