6月30日,主题为“关键之年,让闪存绽放”的2016中国闪存峰会在北京举行,来自产业界的众多嘉宾围绕闪存技术本身将如何演变与发展等热点问题 进行了精彩的分享,在下午的闪存定义新存储架构的分会场中,Infortrend中国区产品经理Vic Cai发表了题为《核心闪存存储系统与云端数据整合》的主题演讲。
Vic Cai:我今天想要分享的是本地数据和公有云之间数据怎样流动。我们知道刚才大家都在说大数据,数据的增长量。说到2020年有可能数据增长量,全球数据要到40个ZB,每年数据增长量由6%到70%的数据增长。
这些数据是不是全都是一些结构化数据?其实不是。这些数据大部分来自于非结构化数据,这样的数据是不是真的都比较适合存在本地,或者说比较适合存在于这样的全闪存阵列里面?
刚才戴尔也说全闪存阵列的成本越来越低,确实随着控制器这样的技术的发展,它的成本比以前来说确实低了。有的客户也开始选用全闪存阵列,因为有很高的IOPS的性能。
但是它相对于云存储来说其实它的成本还是蛮贵的。所以我今天想要跟大家交流的就是本地的核心闪存存储系统与云端的数据整合。
我 这边主要说的是公有云存储,公有云存储其实有很多好处。第一它是以服务形式来交付给客户。就是说你可以按需付费,你需要多大空间和性能就去选择什么样的存 储。一般的公有云的提供商都会有各种各样的,比如有在线存储,或者归档的存储。根据存储性能的不同,或者根据容量不同,有各种各样的收费。不需要去知道你 的东西,你的数据存在哪里,或者说你不需要有专业的人员管理你的存储。因为其实在IT技术架构里面我们说有三大件,一件是计算,还有是网络,地层是存储。 在这三大件里面存储相对于前面的服务器或者网络交换机来说是一个比较专业的设备,它需要很专业的人员来管理和维护它,所以它的后期维护成本还是很大。如果 选用公有云的存储用户就不用考虑这些事情,因为所有的机器都是在公有云提供商里边的,它会替你维护。
但是有一些问题,如果说一些企业想把自 己的数据,或者想把自己的应用放到公有云存储的时候会考虑一些问题。首先就是性能,这个性能问题主要是因为公有云存储,我们知道公有云存储是通过互联网来 提供服务的。这就有一个延时的问题,还有带宽的问题,这个是一些企业应用所不能忍受的。
还有就是数据安全的问题,我们说数据安全,把数据放在自己家肯定比把数据放在别人家踏实很多。
还 有另外一种数据安全的问题,就是怎么管理数据存储IO的问题,传统的是怎么做的?是拿LUN来管理,你是否可以存取磁盘,或者是否可以存取存储。在 NAAS是用用户和密码,还有共享目录的权限管理存取,这些都是企业用户,或者说是用户自己可以去控制的。在云存储方面是不一样的,云存储方面的管理是靠 租户,还有靠虚拟存储池和靠对象文件的管理权限来管理,这个管理你不能控制。这个也是想把自己的数据放在云上要考虑的,考虑到我的数据有可能会泄密。
下 面是接口的问题,传统的企业应用使用的都是NAAS或者SAAS,我们使用的是NFFS等文件共享的协议,公有云不一样,公有云用STTK这样的API的 接口开发的接口协议,这个接口协议在传统的应用,我们说数据中心或者ERP应用上面不可能用这样的API接口,这也是一个要考虑的问题。
还 有价格因素。公有云可以分性能和空间来收费的,其实他们之间有天壤之别,它的收费相差非常大。企业如果把自己的应用放在公有云上还要考虑你的出口带宽,你 的出口带宽太小肯定会影响你的带宽的问题。所以这些都是一个企业想把自己数据放在公有云上所面临的一些烦恼。那有什么样的设备可以解决这样的问题?所以我 们提出了一个JS全新的融合的存储。
刚才戴尔杨总也说过SPC-1,这个基准测试是一个传统存储厂商比较信赖的第三方的测试平台。它有两个 排行榜,一个排行榜是IOPS性能,不管你怎么搭,不管你拿什么硬件,只要搭出最大的IOPS值,搭出300万、500万,不管你花多少钱,有这样一个排 行榜。还有一个排行榜是这样的,它的排行榜是性价比的排行榜,每一个IOPS需要花的成本,infortrend,我们使用了24个SSD,我们跑到了 21.8万IOPS。这个是SPC-1的标准报告,只要去测试他们就会有这样的标准报告。这样有你跑的性能的指标,还有延时的指标,都会在这里面显示。我 们的成绩大家也可以看到,我们在2015年,在排行榜上是排名第一位的。我们每个IOPS只需要花0.24美金。
回到刚才的话题,什么样的设备可以让你既有很高的性能在本地使用这样的企业应用,又有办法让你去使用公有云上面的一些存储的空间。
Infortrend 发布了今年的产品,Infortrend是一家专业研发和制造存储产品的公司,它目标是研发一些高性价比和有市场需求的产品。它的销售模式可能和戴尔等有 些不同,它主要是在做渠道,主要在做OEM厂商,所以市场上知道infortrend的人不是很多,但是在存储圈里面知道Infortrend的人就会比 较了解Infortrend的产品。
Infortrend所引以为荣的就是RAID控制器系统,现在我们这套系统由于比较精简的算法处理 IO就会比较快,如果说有一个几十G或者几百G的操作系统上面我们用什么文件系统搭出一个软RAID,那样去下IO的话,和Infortrend这样的一 个专用的存储的OS来比较的话,infortrend所能够发挥的性能肯定比它来得快得多。这个是infortrend传统的RAID控制器的系统。
在 SAN控制器系统上面infortrend又加入了LinuxNAM,infortrend是在一个机箱里面,一个控制器里面实现所有的存储协议。 Infortrend在融合存储上面增加了对于公有云的整合,至于它怎么整合公有云,用户怎么样用公有云空间我一会儿会介绍到。
当然这套融合存储系统我们也支持SSD,也支持HDD,当然我们也可以把公有云放在这个上面。刚才听到戴尔在讲分层,这个分层我们跟他们有点不一样。我们的分层是建立在SSD、HDD和云端之间,让你的数据做分层,而不是在本地存储之内去做数据分层。
这边是一些存储协议及,比如NFS、CIFS和FC,这样的协议接口我们的JS都会支持,我们还会以对象模式去支持公有云。
当 然我们也支持重删和压缩,重删和压说对存储来讲现在来讲是一个比较基本的功能。你会发现不管是块还是文件还是对象都可以自动迁移到云端来。这边是块,这边 是对象怎么迁移过来?我们有独特的算法和打过程,我们要打包数据,把打包好的数据放在公有云上。打包之前我们也会做重删和压缩,这样不仅可以节省带宽而且 也可以节省公有云存储空间,这个是重删和压缩。考虑到数据安全我们也会采用加密,比如256位的加密算法,经过加密以后数据包传到公有云就不会去担心别人 可以解密,可以盗取你的数据。这是在数据迁移到云端之前我们要做的一些工作。
这个是我们刚才说的,我怎么去把数据迁移到云端,或者说我怎么用本地存储和云端存储。这是服务器,这边是我们的GS产品,这边是公有云。
我 们有一种场景就叫分层,一般分层都在这个内部,我们可以用IOPS、HDD或者NLSAAS,在本地做分层。我们说的分层是本地和云端做分层,我们可以把 数据,这边可以看到是500TB空间,中间有120TB的GS空间,远端公有云有380TB。我们可以做到的是你的热数据可以放在GS,这样可以有本地高 性能和GB的延迟,我们可以自动判断什么是冷数据,什么是热数据,冷数据进行重删和压缩经过加密迁移到云端,做永久保存。这个是分层的应用。
这是GS另外一个功能就是缓存,有一些不同,这边是500TB,云端也是500TB,中间是120TB热数据,写入也一样是先写入GS,从GS把所有数据打包到云端,它判断出热数据保留在GS里面,这样一样不可以达到高IOPS和低延迟的效率,这样不会影响企业的应用。
如 果我们把所有的数据都放到云端,这个能够解决什么问题?当然可以解决备份和异地容灾的问题,在另外一个地方拿到系统一样可以把这些数据读过来,一样可以解 决这种容灾的问题,这异地容灾的问题,这样就不必要说你在这种刚才说的双活量数据中心,你需要两套一模一样的存储。这样其实投资还是很大的。相对于这样的 来说你可以节省很多的投资。但这个是一个应用场景。
下面一个应用场景就是快照,就是分钟级的备份的功能。我们叫它快照,快照的意思是说可以 看到中间是500TB,云端也是500TB,可以把所有文件都存在GS系统里面,通过快照的功能把快照文件存到远端的云端,这时候可以实现异地备份,也是 分钟级的。举个例子,8点你建了一个文件A,然后8点零1分启动了一个快照,这个快照被快照到了云,然后8点5又有一个文件,6点6分又快照到云,这时候 云端和本地端的数据是一致的。你在8点10分有可能会误删除到B,那这时候怎么恢复数据?你可以去到云端找到快照B把文件恢复回来,这个速度也是相当快 的,这是GS系统对云端数据空间做的整合,三个功能,三个不同应用场景可以解决用户三种不同的需求。
这个是GS系统的架构,我们怎么才能实 现这些功能?其实熟悉infortrend的人都知道,infortrend其实是有DS的硬件的技术,还有一个就是infortrend最主要是去年开 发了一套自己的平台,自己的虚拟化平台。这套虚拟化平台不同于别,它是一套非常精简的虚拟化平台。这个虚拟化平台只能运行在自己的这套硬件上面,不可能运 行在什么服务器上面,因为它是专门为了infortrend自己的硬件控制器开发的。在这个硬件控制器上面,在虚拟化平台上面我们开了两虚机。一个虚机是 运行刚才的infortrend的存储OS,就是RAID OS,它的作用是管理RAID。另外一个虚机做NAS,infortrend的虚拟化现在目前只能开两个虚机,它不会像其他的开很多虚 机,infortrend还做不到。而且infortrend的这个虚机系统不是为了非常大的计算,或者说开虚机做计算,而是为了在存储方面有更多功能。 当然在这个技术之上我们可以做很多应用,这个是一个简单的infortrendGS系列的架构。
基于这个架构infortrend其实可以做很多事情,因为我们有了虚拟化层的架构,我们可以在上面做比如说NAS的集群,比如说异构虚拟化,这些其实有了须弥华架构以后,其实这些都是比较容易做出来东西。这些产品也会在不久的将来在系统上加上。
刚 才我说infortrend是主要做OEM厂商的,其实我们也希望我们能够以我们的硬件的平台跟一些厂商来合作,你如果说没有infortrend这样的 硬件的技术,但是你又想去做一些软件定义的存储,那你可以选择这样的一个平台。infortrend可以提供一个非常先进的硬件平台,让你在这个之上开发 自己的存储。去定义你自己的软件定义存储。
下面说一下GS系列。
GS系列就是SAN+NAS+对象,有全闪存和混合配置,也 支持种类繁多的数据服务。刚才我们听到有分层,有自动精简,有SSD还有远程复制,这些infortrend也都支持,还有快照,我们的快照可以快照到公 有云上面去。首先它还是传统存储的架构,还有冗余的双控制器。不同的是在冗余的双控制器里面,在控制器的NAS里面我们看到很少有和infortrend 一样做到控制器结构的NAS的双控,大多数国内厂家可能是拿两个节点来做双控的,而不是说在一个节点内拿两个控制器来做双控。其实我们支持SAN和NAS 透明度转移,这里有一个技术,就是因为有(英文),才会有NAS的透明故障转移,因为(英文)支持文件的断点续传,以前没有的时候我们从网络传一个文件过 去的时候,如果中间网络断了,那那个时候你需要重新再传文件,有了以后就不需要了。这个时候你就可以继续传这个文件及这样才可以实现NAS的透明故障转 移,如果一个一个控制器换了,业务不会停,而不至于说重新传一遍。
当然我们也会有非常高的性能,其实infortrend是以高性能在业界著称及它可以使用比较低阶的CPU或者很低的内春发挥出很大的星梦,单机的性能在全闪存状况下可以达到74万IOPS,这个是端到端的。这是直接跑出来的一个性能。
带 宽方面我们支持块协议的时候我们支持11GB的独带宽,在CIFS,就是NAS性能方面我们支持4GB,11GB的独带宽意味着如果你是做非线编,你可以 做8层,同时做8层的非线编的读写。当然我们也会有统一的用户管理界面,这个用户管理界面里面也会有磁盘的寿命,IOPS的统计,还有日志的统计和日志的 审计。比如某些人干了一些什么事情,在管理界面里面都会有。我们也支持所有的infortrend的产品都可以用同一个管理软件来管理所有的 infortrend的产品,而不是说你是一个SAN,这边是一个NAS,需要两个管理软件来关系,不是这样的。我们是可以用一个软件来管理的。
当 然还有一些任务的支持,我们可以由一些定时的备份,定时的快照,还有定时的远程复制,这些我们都是可以在管理软件里来实现的。最重要的是云端整合,刚才我 们介绍我们支持把数据分层到阶段,我们也支持把数据缓存在本地,所有数据保存在云端。当然我们也支持快照,把快照放在云端,把数据放在本地。
所有这些功能都是不需要人工去处理,所有这些都是控制器自动完成的。
GS为改变而生,今天我的演讲就到这里,谢谢大家。