数据存储产业服务平台

VMware创新网络架构师殷剑:企业云下的软件定义存储

软件定义是2012年VMware提出软件定义数据中心的概念,其中SDS作为软件定义数据中心一个非常核心的技术之一,软件定义计算、软件定义网络+软件定义存储,构成了软件定义数据中心和云的基础技术,这改变了整个行业的架构范式。

如果我们从现在看未来,整个软件定义存储会要往哪里走?或者解决哪些问题?我们稍微往后退一点看一看,这五年里整个行业大的变化,或者最深远一点的变化是什么?

我觉得从2014年到现在5年时间,可能整个行业越来越关注的是用信息技术推动行业做一个数字化的转型。这是一个非常广泛而深刻的影响,已经不局限于IT行业了,是整个社会的变化。

而IT在这里扮演了核心的角色,两个大的驱动力,一方面来自于这个行业本身特性,是高科技行业,所以整个技术的革新或者技术的不断迭代、革命,另外是业务模式或者商业模式,或者互联网,以及这2~3年用人工智能的方式推动发展,这两个有着非常深刻的影响,推动着所有企业向数据化转型方向去走,而这当中一般会要求整个企业要具备两个能力变革:一是创新;二是敏捷。要么逆潮流,要么非常快适应潮流变化,否则你可能会被颠覆,被隔壁的巨人改变游戏规则。

而在这个大的背景下,VMware在这个环境下,提出了企业云。我们认为在数据化时代,有决心的企业都会要有勇气构建自己的云平台,云平台变成3个层面的工作。

最基础的是我们认为每个企业会构建自己的企业云平台,云这个技术经过十年迭代演进,大家对它有了更深的理解,这个云平台不是传统意义上或者过去提到的私有云公有云,而是混合云形式的,私有云、公有云只是一个属性但并不是核心,关键是我们怎么调度和使用这些云资源和技术。在这个基础上每个企业会搭建自己的数字化应用,我们觉得技术架构会从软件定义慢慢向应用驱动的方式来演进,每一个企业都需要数字化或者数字化的基础设施,VMware是说我们将来会提供这三个层面的平台。

大家耳熟能详这2、3年从AlphaGo开始,到今天3年时间,人工智能、深度学习、预测分析、实时分析等等,不断加速、迭代,不断的演进、深入,所以这些新的业务或者新的应用,或者这些新的业务场景,会对整个IT技术提出新的要求。如果从技术栈角度来讲从应用平台到上层应用技传统交易、大数据、机器学习、机器预测等等,这种应用都会有非常大的变化。

那这背后会是一个很复杂的云环境,会混合私有、公有,融合私有、公有,不会特别关注这个资源的属性,更多关注这个资源本身属性根消费。在这个基础上,还会延伸出更大场景,就是马上即将到来的IoT,万物互联,会导致边缘平台出现,边缘平台会跟云搭建成一个更新的云的生态,更复杂的云生态。

作为软件定义存储技术需要考虑的一些不同的纬度,包括在混合云的环境下,或者在未来云的生态环境下,软件定义存储这个技术怎么发展,包括一些创新应用、机器学习、预测、人工智能等等,在传统大数据新一代演进架构下,对软件进行存储有什么样不同的要求。同样将来使用软件定义存储的方式会发生变化,在这么一个复杂的环境下,管理的需求、企业对于软件定义存储管理的要求,不应该被忽视或者安全治理等等。

从混合云讲起,大家如果关注云的发展大家会注意到VMware跟传统企业级供应商和公有云的AWS,这三年我们做了三次大的联合的发布,我们创造了整个行业比较创新的公有云跟传统意义上私有云合作的模式,就是VMware整个软件栈运行在整个全球的AWS基础设施上,在上面运营了VMware的软件堆栈,同时无缝衔接VMware跟AWS堆栈和网络通路,所有用户可以登陆VMware的Portal,任何用户不用担心现有中心和全球化数据中心,构建一个云的环境,搭建了一个私有云和公有云的混合模式,我们叫做VMware新一代Cloud on AWS,这是VMware未来三年全力推广和发展的云模式。

今天我们在这种模式下对SDS提出新的要求,原因很简单大家做混合云,这不是一个新的概念,在混合云落地的时候有非常大的挑战,不同的堆栈,即使聚焦到存储这个领域,每一个云,私有云也好、公有云也好,每一家都有自己的堆栈,在这个堆栈上怎么保证数据的连通,我们创建了个Customer Data Center和AWS Global Infrastructure,而且无缝连接,进行数据迁移,这里要解决很多问题,包括中间的网络连接、以及存储的问题,都需要全栈支撑。我们觉得这个模式会让用户希望拥有的混合云模式变成现实,而不只是一个市场的愿景或者大家的愿望,如果不解决存储堆栈之间的连接问题,或者说两个不同的云堆栈之间的问题,SDS能否在混合云环境或者未来多云环境下,变成阻碍或者拖后退的问题。

我们刚才讲了VMware跟AWS模式,但是这个模式不局限于VMware和AWS,可以变成VMware跟Cloud,我们会跟全球主流公有云供应商,包括国内领先的公有云供应商推广混合云的模式。这样整个负载可以在数据中心和公有云中间非常方便的流动,真正实现私有云的优点,具有可控以及成本的长期优势,公有云的弹性优势,把这两个优势选择权完全交付给企业用户。

我们谈技术,混合云将来会变成现实,从一个市场炒作的概念变成一个真正的现实,但是整个存储行业有自己的特点,今天很多主题也讲到,所有数据总要存放在一个介质上,这个介质在这几十年里经过两代到三代的迭代发展,从传统的磁盘技术,基于磁盘到SSD到持久存储等介质技术,基本推动了每次存储行业非常跳跃式的发展。原因也很简单,因为持久性内存马上要到来,我们今天会涉及到PMEM,基本上未来存储会接近内存,但是又具有存储优势。但是这个技术的落地,会对整个存储架构产生一些非常大的促进,大家可能熟悉这个行业里我们最早都会要有算法,然后再优化,再做分布式,今天可能改变了这个架构,但是未来对整个存储架构会有非常深刻的影响,可能所有存储架构都要重新思考自己下一代架构怎么搭建。

因为整个延时会提升2、3个数量级以后,对于所有堆栈包括操作系统的内核调度、网络驱动,整个数据访问,这种分布式架构的所有原来假设可能都要打破重新思考。

VMware首先会支持两类持久性存储技术,一类是PEME技术,另外一类是以英特尔为代表的傲腾技术。这两类技术各有它的技术特点,但是基本上是平衡了一些价格、延时、技术成熟度、工艺等等,但是基本是接近,会提供接近内存,同时会保持存储特性,保持持久化的特性,未来也许最大的变化可能是在整个规模化落地,或者成本方面有规模经济效应,以及成熟生态建立在哪个技术路线上,但是VMware在最新产品上已经支持这两类技术。

为什么存储技术还有不断的压力或者驱动力在各个层面做革新,原因很简单,我们首先从业务角度看,整个存储在整个应用或者整个云堆栈里,延时所贡献的比例还是最高的,如果存储做了提升,他业务相应和业务决策时间会大幅度提升,因此今天存储业务提升还会对整个业务产生非常有深远影响的意义,如果内存技术接近于数据库技术,那我们的技术会有非常大的提升,因此对行业是有非常深远影响的技术。

分享一个数据,如果存储变快了10倍或者100倍的时候,未来新的负载,比如说机器学习,整个学习训练时间,尤其是预测方面,实时预测,会有显著提升。

刚才讲了存储这个领域的性能是非常关键的,或者非常有意义的,除了介质技术跟软件架构做迭代提升以外,整个存储网络技术也要会去迭代演进,网络里面我们会用虚拟化技术平衡很多管理跟性能,所以我们在支持持久化存储技术的时候,我们提供了两条路径。一种方式是直接把它作为块设备,通过原有存储通道、存储的虚拟化方式提供给应用。还有一种方式,我们把它以接近原生的以字节为单位的设备提供给应用,我这里的应用是说未来的内存数据库、未来大数据平台,可以以两种方式使用新一代存储介质,透过虚拟化管理平台,或者云平台来消费下层的资源池。

所以VMware会提供整个虚拟化堆栈里对持久性存储的映射,通过虚拟化层我们最新产品vSphere 6.7,去支持所有虚拟化存储,就是刚才讲的两种设备的映射,都可以给到实际访问。

网络里面大家熟悉虚拟化,可能IO虚拟化扮演了非常重要的角色,也是两个技术路线,一种技术路线是基本平衡功能跟性能的折中,一种方式是倾向于性能,通过SR-IOV方式映射给应用,有直接的原生驱动使用这个设备。还有一种方式是通过更多字一层逻辑映射的方式,但解决了不同设备之间的差异,对虚拟机操作系统的驱动依赖会下降,但是会平衡管理性跟性能,第一种会牺牲掉虚拟机的性能,第二种不会牺牲,但是我们测试里,大幅度提升SST下的存储性能,延时性能也大幅度改善。

我们刚才是讲整个技术堆栈,因为新一代技术的出现,需要做每一个层面都会做自己的适配,或者重新架构、重新重构。

同样对于今天的软件定义存储不会独立的存在,不会孤岛一样的存在,我们觉得不管什么技术的云,什么技术搭建的云,云一定是个SDS平台,所以SD会分成控制层面、策略层面,策略层面纳入到云管或者云管理平台,这样一个架构的升级。所以大家会看到整个VMware把数据平面跟上层数据平面做平衡,同时架构不只服务于VMware自己的SDS技术,因为云是一个生态架构,所以VMware不只提供自己的SDS技术,我们还会做自己的混合云平台,混合云平台也用同样的架构适配我们所有市场上主流的SDS堆栈或者SSD技术,这样给我们的企业用户有更多的选择,在SDS这个层面用户可以选择VMware企业云平台认证的所有的主流的软件定义存储的技术。

最后我们要强调一下,软件定义存储这个技术从一开始的时候,更多的是借鉴了一些互联网技术的发展,但是最早进入企业技术中心时候有一点被忽视,整个企业数据中心企业用户对存储技术有很多自己的管理、治理,企业级的特性,包括有很多SDS技术开始发展的时候,甚至我们都没有完整的考虑容灾、备份,我们同时贡献了我们自己研发的接口,但是变成一个VMware云平台的开放接口,让我们自己的SDS技术可以达到这个标准,我们跟SDS平台对接的时候有一个标准接口纳入到平台里,因此它是一个完全开放的平台,共同推进整个SDS存储行业在进入企业以后,对企业用户不要变成存储技术,存储堆栈完全大量的非兼容技术,或者我们有时候跟用户交流的时候,我们有一个大家非常痛苦的地方,是整个企业用户技术堆栈复杂程度远远超出我们公有云技术堆栈负责程度。

原因很简单一个SDS技术供应商之间的兼容性,这种接口的标准性或者开放性,其实是整个行业的挑战。一方面我们各个堆栈之间,比如存储跟云平台之间,包括我们跟公有云基站做集成,我们会向标准化、开放化演进,今天公有云也走到一条路,各个公有云堆栈之间不兼容、不开放,因此导致一个个垂直的,但是又是孤立的系统,对于企业用户来讲有大量的企业用户想要在数字化时代构建自己平台的时候,面临着太多的堆栈要么去适配大量不必要的复杂性,要么是被锁定的局面。

(本文根据速记整理,未经本人审阅)

未经允许不得转载:存储在线-存储专业媒体 » VMware创新网络架构师殷剑:企业云下的软件定义存储