12月10日下午,2015中国存储峰会在北京举行。在“云计算与业务连续性分论坛”,“高端存储知识”CHO 西瓜哥发表了“高端存储,云云众生”的主题演讲。
以下是演讲实录。
“高端存储知识”CHO 西瓜哥。
西瓜哥:今天我是最后一个议题,谢谢DOIT给我这个机会讲讲高端存储。我会经常发一些关于存储方面的文章,高端存储知识更多一些,主要代表我个人对各个厂商的一些解读,分享给大家。
今天这个论坛,主要是讲云计算和业务连续性的,其实对于企业存储来说,云是存储技术革命4大因素之一。
DOIT存储搞了4个分论坛,也是按照IDC预测的4个存储革命技术设计的。其实这个高端存储的话,应该受闪存影响最大,第二个可能是软件定义。云以前受它直接影响的可能不是很多,但是现在可能形势不一样了,比如说现在EMC收购云的公司,现在也会把一些关键业务迁到公有云上,以后数据量大部分迁到云上以后,高端存储也是受影响的,整个企业的存储都会受到这些市场因素的影响,我主要讲高端存储在云这方面做的改变,怎么如何利用这个趋势,继续卖好自己的高端存储。
回顾一下我研究的高端存储。
根据IDC的定义,IDC认为比较贵的就是高端,定一个价格区间,比如说在100K的存储就认为是普通的高端存储,国外的话,一般定义是250K,这是按钱来说的。
第二个是技术派的,Gartner 11月份发布了高端存储的研究报告,它对高端存储定义了一些指标,理论上他认为支持多控架构这种存储,任何一个部件损坏,性能损失低于四分之一,平均售价250K起。它认为在全球上,大概有12款产品符合高端存储定义,把这12款产品定义为高端存储,这是比较典型的代表。
它们观察的这些存储厂商,首先要求是国际公司,只在中国有业务是不行的,有一些条条框框,这些公司必须在Gartner存储的魔力象限里。有8个维度,对关键能力进行打分,管理性、可靠性、性能、快照、复制、扩展性、生态系统、存储的效率等进行打分,然后给出一个排名。打分以后排名是按5个应用场景算的。
高端存储一个是整合,第二个是数据库App,第三个是服务器虚拟化,第四是分析场景,最后一个是云场景。
云就是指私有云和公有云进行对接。这8大关键能力哪个比重最大?我分析了一下,比如说我们看到对管理性要求很高,16%的比重。要做云的话,这个存储扩展性很强,很难管理,所以管理性要求很高。
第二个是可靠性,但相比其他场景,可靠性要求是降低的,在普通数据库的场景是18%的重要性,这里变成15%,可靠性在云里面,相对要求没有那么高。
还有扩展性,高端存储扩展性很好,但是对云业务来说,不一定够,所以对扩展性看得比较重。
还有多租户安全性,在云里面,客户来自于不同的单位,不同的独立个体,他们之间相互的隔离,安全性等。
我们看到这是它的观点。每个应用场景都有一个比重,最后有一个总的比重。
我们先看看云的排名,如果针对云来说,认为目前的高端存储比较适合在云上用的话, NetApp做的比较好,管理性也不错,所以排在第一。第二是日立,第三个是HP,比较传统的高端存储厂商,日立比较靠前,传统厂商在里面也有不同的区别。除了云以外,把5个业务场景按比重算起来,这是总的排名。
第二个,我们可以看到高端存储应用场景,大部分是小型机。高端存储在下降,但是目前主流还是用在小机和大机上,我们看到对大机的支持,这是高端存储非常重要的场景。
应用主要分布在金融行业,还有电信、政府,金融行业占了一半,这是高端存储的现状。
从1956年有第一块硬盘以来就有存储了。存储刚开始的时候,是伴随IBM大机产生的,最后大机也在变化,然后有小机,存储也是这样的,高端、低端、中端,存储真正发展起来应该是1990年,摩西亚纳研发的symmetrix,通过raid技术和cache把可靠性和性能都解决了,成本下降很多。往下就是日立1995年推出自研高端,形成三国鼎立的状态,然后就IBM发布Shark,2000年的时候,日立用了交换技术,把交换技术引入到高端存储里面。3Par是2002年开始做存储的,后来被惠普收购。EMC2003年变了一次架构,取得了市场的成功。2004年IBM DS8000推出来了,现在这个产品一直在更新。
摩西亚纳2005年创办XIV公司,被IBM收购了,现在IBM还在卖这个产品。2009年的时候,我们看到EMC又把架构换成松耦合的架构,用交换机的架构,再往下就是华为2012年发布了自己的高端存储,2014年,摩西亚纳推出了infinibox。高端存储一直在发展,也受到云、大数据方面的冲击。
云(私有云和公有云)这块,高端存储做了哪些改变拥抱变化满足客户的需求,可以继续卖传统架构存储的产品。
首先讲一下双活,我们知道双活说白了是私有云里面很关键的一个特性。做好了,对整个私有云的业务连续性有很好的作用。传统的方式双活都是用网关技术,网关技术双活有一个问题,为什么?双活的话,因为高端存储的可靠性和性能比网关好,网关配高端存储,这种方式对整个系统的可靠性,我认为降低了高端存储整个的可靠性,因为本身的性能可靠性更好,加一个虚拟化网关是不好的,高端存储不是特别适合这样的场景。
日立就先解决这个问题,高端存储里面内置了网关解决双活的问题,日立选择了这个方式。去年4月发布了VSP G1000,发布双活的特性GAD。两套存储,原来做远程复制的时候,只能写一边,另外一边没有办法写,只能读。应用部署的时候就非常麻烦,另外一边资源就浪费了,如果系统出了问题要切换。双活就解决了这个问题,两边可以同时写,也用了分布式锁的机制,把这些数据进行加锁,保证数据是一致的。
有了双活技术以后,在应用层面私有云的产品结合起来,可以构造两个很可靠的双活数据中心,比如说和VMware做双活,可以做应用层的计算切换,存储方面自己可以搞定。Oracle RAC可以做数据方面的双活。跟微软也是这样的,可以跟它做微软环境下,和它配合进行双活。
今年5月,华为推出18000V3和HyperMetro,这也是双活,原理跟日立的是一样的,但是细节上实现的不一样。比如说华为的锁盘,不是用阵列做的,用虚拟机做的,用软件做的锁盘,日立必须布置另外一套存储。华为这个产品,有一点自己的特色,比如有一个跨站点坏块自动修复,这块读不出来,会自动到远端读数据,发现坏掉的话从远端数据读过来把坏块修复,做了快写,惠普也有,很多厂商都有,都有自己的特点。
华为产品比较全,比较强调端到端的双活,因为它有底层的传输设备,还有上面的数通和安全设备,会优化传输层,双活对时延要求很严格,部署的距离越长,传输层的话,对波分设备进行优化,可能会带来很好的效率,对防火墙的隔离,跟双活的设备切换关联起来。华为现在做一个工作,大家知道两个数据中心如果出了问题,一个数据宕了,另外一个数据中心的存储层和网络层都有自己的判断,这两个地方判断可能不一样。比如说存储这边是没有问题的,但是网络坏了,所以把存储切到这边来,但是网络这边,用户的终端访问不到这边的存储,业务也是中断的。华为做研发,把设备策略做联动,存储层、网络层和客户的网络联动起来,条件满足的话,会切换到客户能访问的数据中心。2015年Q3的时候,EMC推出VMAX3和SRDF/Metro,跟日立的差不多。
传统的厂商拥抱双活提高私有云业务的连续性。双活有很多热点的争论?比如说真假双活之争,很多存储厂商都支持双活,但是IO可能是转发,你以为写给这个阵列了,实际上必须通过写转发到另外一个节点,那边落盘,通过底层复制过来,在整个IO留存比较长,性能会差一些。有一些双活可能不支持优先级,这个坏了,切到这个,有优先级没有仲裁,网关和阵列之争,高端里面我建议是不用网关。
第二个我们讲讲对VMware的支持和改变。最大的变化就是VVOLs的支持。没有VVOLs的时候,就像左边的情况,高端存储容量很大,性能很高,但vmware只能看到256个LUN,有了VVOLs以后就比较简单了,可以用虚拟机的力度进行管理,可以实现自动化。其他的原理很简单地大家知道VMware开发自己的VSAN,然后把自己的接口公开了,就是VVOLs,对外公布了。可以利用这个接口跟VMware的存储连接,通过一个协议访问点进行访问,这样的话就可以没有LUN数量的限制,而且管理力度更细,关键是可以做到自动化的部署。在大数据中心,私有云的场景,这个非常有用,部署自动化是最重要的一块。不一定用VSAN的架构达到,可以用VVOLs加高端存储。
在VMware的网站上,目前的高端存储厂商,除了IBM的 DS8000和InfiniBox,其他的厂商都支持VVOLs,高端存储厂商也在变,也会拥抱私有云的环境。这是很正常的,这是传统的强项。
EMC的VMAX3有一个特点,有一个SLO,支持比较好的服务等级的管理,服务等级和VVOLs的特性结合起来,做策略的时候,可以直接用等级的方式管理。比如说用多少时延的卷,后台自己部署了。
看看其他的场景高端存储怎么做。私有云是传统的领域。公有云高端存储主要做块设备,比较火的是Opnestack,目前在私有云里面用的很多。部署Opnestack跟部署VMware的比例差不多了。全球的厂商主要在下面这个,存储厂商提供相应的接口,让Opnestack用到自己的存储,这里有一个块存储的接口。
前两天我查了一下,高端存储厂商,大部分都会支持Opnestack cinder接口,只是大家支持的版本不一样,惠普的XP系列支持最新的liberty版本,华为支持主流的Kilo版本,很多厂商支持QoS。IBM DS8000并不落后,在卷的复制这块也支持。Opnestack也是可以做私有云场景的,高端存储也在转身,拥抱这样的应用环境。
再看一下Docker容器这块,高端存储怎么支持。现在很多应用都叫微服务,因为它更灵活,具体优势就不讲了,容器现在很火,我觉得未来对VMware有很大的威胁。
高端存储拥抱Docker的只有华为。Docker是共享操作系统,优势就是资源的占用非常小,更加敏捷。但是Docker有一个问题,容器应用迁移的时候,数据卷一般不带出去,数据是没有状态的,一般对web应用没有问题,但是对数据库的应用来说,有状态的应用来说是比较大的问题。国外有一个很火的公司,创始人很年轻人,大概2-30多岁,他们做了一个产品叫FLOCKER,这是一个容器的卷管理技术,容器迁移出去的时候,数据跟着容器迁移,FLOCKER主要是容器卷管理工具。支持很多存储的集成,当然自己也可以做数据的复制。他们公司叫ClusterHQ,合作伙伴主要有VMware、华为、EMC这些。
用云网关的方式拓展高端存储的数据服务,主要是EMC,EMC收购了cloudarray公司,把它的产品纳入到高端存储里面来,数据可以从高端存储根据服务等级的要求,最后一直迁到云上。可以分层,可以把公有云和私有云作为存储的一层。
软件化后直接部署在云端,IBM用的就是软件定义的技术,把软件独立出来,直接部署在虚机上,部署在普通的硬件上,普通的X86服务器上,把它放在云上,可以跟其他的XIV复制,可以被主机访问,可以和软件定义的存储通讯。软件化以后,把它部署在公有云上,用户可以把数据直接迁移到公有云上,享受高端存储的好处。
高端存储怎么对待云转变?我用一句话来说,《破产姐妹》里面有一句台词,与其奋力挣扎,不如闭眼享受,云大潮阻挡不了,只能拥抱云,在私有云领域用双活巩固私有云这块可靠性的地位,通过VVOLs,Cinder这样的接口,或者FLOCKER这样的东西拥抱私有云、公有云,通过协作的方式跟公有云进行互动,内置云网关把数据迁移到云,也可以把自己软件化,把自己云化,变成公有云上的一部分。
云这个环境,对各行各业产生很大的影响,高端存储在云的环境下还是有自己的应对之道,可能也会延长自己在云环境下的寿命,未来云发展很好的时候,这些传统的方式可能就不再需要了,但是演进的周期比较长,高端存储还会有自己相应的位置。
今天我的演讲就到这里,谢谢大家!