前言:傲腾在用户实际需求中真正创造了价值也获得了市场上的成功,但傲腾的成功推广离不开标杆客户,OEM合作伙伴以及软件应用生态。
2019年9月,距离基于3D Xpoint介质的Optane(傲腾)正式发布(约2017年3月)已经有大约两年半的时间了,两年多时间以来,Optane的神秘面纱一步步揭开。
从P4800X开始,最初的Optane只是特殊介质的SSD,比基于NAND的SSD的延迟更低,寿命、耐久性更强,而后,傲腾持久内存方案发布,傲腾开始部分取代DRAM内存的场景,迎合了大内存的场景需求,用法也愈发多样化,傲腾的出现弥补了硬盘与内存之间的性能与容量鸿沟。
傲腾SSD作为比NAND SSD高一级的存储层,傲腾持久内存作为比内存低一级的存储层,弥补了硬盘与内存之间的性能与容量鸿沟
3D Xpoint被视为存储产业的颠覆者,许多人对3D Xpoint相对于传统NAND 1000倍的速度,1000倍的耐久度,10倍的存储密度,内存一样的字节寻址特性,块擦除特性等等多种优良特性充满了期待,英特尔也不负所望一步步释放3D Xpoint的价值。
英特尔非易失性事业部中国区总经理刘钢在最近一次采访中感慨道,以前提到傲腾的时候大都在说傲腾是什么,能做什么,而现在,傲腾的实际落地案例是越来越多了。
英特尔释放了3D Xpoint的价值
小图1:傲腾SSD能表现出始终如一的低延迟
小图2:傲腾SSD的DWPD是3D NAND的20倍
小图3:用较少容量的傲腾P4800X就能替代基于3D NAND的SSD缓存
上图可见,作为SSD硬盘的傲腾,在高读写工作负载压力下能持续稳定表现出超低延迟,这点最令笔者印象非常深刻。而在同等负载下,NAND的延迟已经高出了很多,而且延迟抖动非常厉害,性能表现无法预测和控制,低延迟特性在许多关键应用中非常受用。要知道的是,这里的低延迟主要是3D Xpoint介质本身的优势所致。
对比普通SSD跟傲腾SSD会发现介质在降低延迟方面的效果,
这种延迟提升只有硬件能带来,是任何软件优化都做不到的
在实际应用中,阿里云的PolarDB数据库将日志数据存放在了傲腾DC P4800X里,把数据放在了NVMe SSD里,提升了其QoS、IOPS、吞吐带宽,帮助PolarDB数据库输出了稳定的高性能服务。类似的,四川电信ABM系统中有也许多OLTP应用,傲腾DC P4800X在应对高并发业务的情况下表现出低延迟作用也非常明显。
傲腾SSD的加高分:加速作用,高速缓存作用和热数据存储层
在上述案例中,3D Xpoint介质的低延迟和高性能特性都功不可没,这点可以按照上图总结为傲腾SSD的加速作用。当3D Xpoint介质的高性能结合高寿命(高DWPD)的特点时,傲腾SSD就有了另外两大作用场景——用作高速缓存和用作热数据存储层。
作为率先在市场上推出QLC的厂商,英特尔推出了傲腾SSD+QLC的混合存储方案,利用傲腾SSD性能和耐久性充当高速缓存,同时利用QLC的大容量低成本的特性,替代原来许多用NAND SSD做缓存用磁盘做主存储的场景,性能大幅提升。
利用这一方案,百度ABC Storage全闪对象存储服务的性能和规模都有所提升。在vSAN和Ceph这样的分布式存储方案中,同样也把傲腾SSD用作缓存,配合QLC做主存储容量,性能以及性价比都有大幅提升。
傲腾持久内存带来的颠覆性就更大了,作为可部分替代DRAM内存的新硬件,傲腾持久内存凭借比内存低一些的价格,比内存高的多的容量,开始被当做内存使用了。
百度的Feed流推荐服务要面对亿级用户,考虑到高并发、高性能和低延迟的要求,百度构建了内存KV数据库Feed-Cube,但随着数据量的增长,DRAM扩展带来的成本越来越高,而且单位容量也限制了Feed-Cube性能的发挥,经过一番开发调整和测试,百度的内存KV数据库Feed-Cube底层已经完全从DRAM内存换成傲腾持久内存了,性能略有降低,而TCO则有较大降低。
百度的Feed-Cube换傲腾持久内存需要进行许多改动,而海鑫科技没做太多优化,直接用傲腾持久内存部分替代DRAM后,总体成本上有大约29%的降低,而性能与原来的DRAM方案相当。海鑫科技的例子对普通用户来说更有参考价值,从一定程度上来说,傲腾持久内存其实已经具备了大面积普及的能力。
从上述应用案例中,我们能看到,傲腾是市场上第一个,也是目前市场上最成熟,最主流的商业化SCM(Storage Class Memory)解决方案,可以说,截止到目前为止,傲腾方案的推广落地效果还是比较成功的。
翻看许多案例会感觉,也只有在数据中心领域有特殊地位的英特尔才能如此之快的推动傲腾落地,但也应该知道,只有英特尔自己是不够的,还需要标杆客户,还需要OEM合作伙伴以及软件应用生态。
标杆客户
普及一项颇具颠覆性的新技术,难度可想而知。
一些用户只能看到单位容量傲腾比NAND要贵,这只能说明对于傲腾存储的真正用法不够了解,还有一些已经了解傲腾用法和特性的企业,但对于傲腾需要的技术门槛以及对现有架构的调整有所抗拒。所以,我们看到的一些案例中,更多的都是国内互联网领域极为活跃的企业,他们敢于尝试新技术。
实际上,在许多案例中,为了能充分利用傲腾的性能,通常都需要英特尔的专家与超大规模数据中心用户的技术专家密切配合,要求用户侧也有很高的参与度。
幸运的是,因为,大规模数据中心的任何创新都可能带来非常可观的收益,所以,用户有动力也有技术去参与,在软件和硬件层次上做很多开发和优化工作。而且超大规模数据中心的用户一般都会成规模地使用新的硬件方案,会对同类用户起到很好的示范效应,树立标杆用例。
但从方案本身来讲,傲腾作为硬件层的颠覆性创新方案,其实也少不了OEM厂商的支持和配合。
OEM合作伙伴
2018年,浪潮服务器出货量以及销售额都位列全球前三,中国第一,浪潮的成功得益于JDM服务器大规模定制化生产交付模式的敏捷创新模式,在中国超大规模数据中心互联网服务器市场非常受用,可以说,浪潮非常了解超大规模数据中心对于服务器以及相关的各种需求。
巧的是,英特尔傲腾现在的主要用户也在这一市场,双方的合作便是顺理成章。
据浪潮信息解决方案部副总经理魏健介绍说,浪潮与英特尔的合作始于2018年5月份,在浪潮NF5280M5服务器平台上用傲腾SSD以及傲腾持久内存做了许多方案,基于傲腾SSD的方案有关于浪潮K-DB数据库,VSAN,Ceph,HBASE,Spark以及Redis,基于傲腾持久内存的有Spark,Redis,Hbase,HANA。
2019年4月以来,这些方案都已经陆续发布了,而且已经在包括BAT,快手,平安科技,科大讯飞等一些企业客户中得到了大范围应用。据了解,采用傲腾SSD方案中最多部署了600多个服务器节点,采用傲腾持久内存的案例中最多有做到300多个节点的集群。
魏健在与许多用户接触中发现,用户非常关注傲腾SSD在延迟上,写入带宽上,尤其是相对于传统NAND SSD在寿命上(大约相差十倍)的表现,也非常关注傲腾持久内存相对于传统内存在大容量(单条最高512GB),低成本,以及非易失性方面的优势。
浪潮实测后发现,有了傲腾持久内存的加持后,Redis的性能能有12-21倍的性能提升,Hbase的TPS性能大约有2倍的提升,延迟方面也能降低近一半。
从魏健的介绍中了解到,虽然说傲腾的单位成本确实比NAND SSD要高,但在一些场景下,傲腾却能在成本降低的情况下让性能得以提升,或者新系统比原有系统成本要高,但是性能提升也非常明显,但一定会带来性(整体性能)价(整体投入)比的提升。
经实测后发现,当把傲腾SSD用做VSAN的缓存之后,VSAN的性能表现比纯NAND SSD支撑的版本,性能有50%的提升。最重要的是两种方案的成本一样。类似的,傲腾SSD+QLC的异构混合方案在加速Ceph的时候也有类似的性能提升,成本还有所降低。
作为服务器厂商,浪潮需要在考虑服务器特性的基础上,结合数据中心用户的特点,面向傲腾做各种层次上的优化,需要长期反复调整和优化才能做出来,在成本,性能,稳定性等方面都合格的最优方案。浪潮凭借在超大规模数据中心市场的积累,率先在市场上推出了基于傲腾的服务器方案,为用户带来了特有价值,也巩固了在服务器市场上的地位。
软件与应用生态
傲腾持久内存有两种应用模式,一种是内存模式,该模式下用户可以直接将傲腾当做内存来使用,另一种模式是App Direct,需要应用层面做许多修改和优化,浪潮也都参与到其中。
从魏健的介绍中了解到,虽然App Direct需要改动应用程序,但目前包括Spark,Redis,HANA,Hbase等在内的各种应用以及一些操作系统也都开始傲腾持久内存的App Direct模式了。
从英特尔非易失性解决方案事业部中国区总经理刘钢的介绍中了解到,也有许多中国的软件公司希望能利用傲腾的优势来打造解决方案。除了互联网超大规模数据中心用户以外,金融行业、能源、物流、电信、零售业用户也希望能将傲腾放到自己的业务当中,傲腾的下一阶段可能将会有许多来自垂直行业的案例。
傲腾的生态正在逐步构建起来,应用生态是现阶段傲腾落地的加速器,也是傲腾持续落地和发展的重要基础。
结语
从现有的傲腾存储的案例来看,主要用法就是将傲腾SSD当做高耐久和高性能的缓存层,将傲腾持久内存当做内存的补充来用,对外提供大容量内存。应用类型上,主要集中内存密集型应用和延迟敏感型应用,比如AI和数据库等应用,未来是否会在更多场景下得到应用,也得看用户实际需求。
考虑到3D Xpoint介质本身的特性,再来看看现有傲腾产品的特性,笔者认为,其实可以对商业化的SCM存储留有更多的想象空间。