编者按:由DOIT传媒主办,中国计算机学会信息存储专委会、武汉光电国家研究中心、百易存储研究院支持的2024中国数据与存储峰会,2024年11月8日,在北京新云南皇冠假日酒店圆满举行。
在下午分论坛“大模型存储分论坛”上,西安紫光国芯半导体股份有限公司发表了《用CXL设备实现服务器内存的容量及带宽扩展》的演讲。
以下内容根据速记整理,未经本人审定:
紫光国芯:大家好,今天我分享的题目是用CXL设备实现服务器内存的容量和带宽扩展。
首先,给大家介绍一下西安紫光国芯半导体股份有限公司。
紫光国芯的前身是2004年德国英飞凌成立的西安研发中心存储器事业部,到如今已有近20年的历史,我们是一家以存储技术为核心的产品和服务提供商。早在2019年随着CXL技术的正式发布,紫光国芯就开始紧密关注这一技术的发展,并于2020年加入了CXL技术联盟成为contributor级会员,深度参与相关标准制定的技术讨论,并一直积极参与相关技术的探索与布局产品落地。2022年紫光国芯发布了CXL产品路线图,并于2023年开始自研CXL相关产品的客户送样工作。
CXL技术基本概念
CXL即Compute Express Link,是一种开放式高速互连技术标准,旨在实现计算和存储系统的高效数据访问,特别是为了解决计算和存储之间的“存储墙”问题。
CXL的技术联盟成立于2019年3月,全球头部的CPU厂家与服务器厂家都参与其中,联盟2019年3月份成立时发布了CXL1.0协议标准。半年时间后发布了CXL1.1协议标准,后续首批落地的产品都是基于CXL1.1的标准。
2020年10月,联盟发布了CXL2.0协议标准。2.0协议最大的特点是可以实现内存的池化,支持多个主机和存储器设备之间的互联,实现带宽和容量的有效扩展。
2022年8月,联盟发布了CXL3.0协议标准,增加了fabric的概念,支持多个Switch之间更高维度的互联,可以应用到更高的体系架构中,实现进一步内存和带宽的扩展。
到目前为止,CXL技术联盟拥有超过200多家成员, CPU厂家、服务器厂家、存储器厂家陆续加入,整个生态在飞速发展阶段,各种各样的产品已经落地应用。
CXL相关产业生态
以英特尔和AMD两个CPU厂家为例来介绍一下CXL的生态。
2023年初,英特尔发布了支持CXL1.1协议的SPR CPU,接着又发布了另外一款基于CXL1.1协议的EMR CPU。今年三季度,英特尔发布了两款支持CXL2.0协议的CPU, Granite和Sierra Forest,CXL通道数从SPR和EMR的32个增加到64个。
AMD也是2023年发布了支持CXL1.1协议的Genoa CPU,今年二季度发布了支持CXL2.0协议的Turin CPU。
同时国内越来越多的CPU厂家、服务器厂商也在布局CXL技术,推动应用加速落地,尤其是CXL TYPE3领域。
基于CXL技术的典型应用场景
基于CXL技术的典型应用场景整体有TYPE1、TYPE2和TYPE3三种。在详细介绍三种应用之前,先了解一下CXL协议本身。
CXL本身是一个开放互连的协议,从内部子协议来看支持CXL.io、CXL.cache和CXL.memory,CXL.io跟PCIe协议非常类似,其实CXL本身采用了PCIe的物理层,比如CXL2.0和PCIe Gen5的物理层相同,CXL3.0跟PCIe Gen6的物理层也一样。从协议的角度,支持.io,主要是实现计算机的配置,.Cache可以实现Cache类型的memory的访问,.memory可以实现memory类型存储设备访问。
基于三种子协议可以组合出来各种各样的应用场景,比如TYPE1支持CXL.io和CXL.cache,这样就可以应用在一些Cache类型的设备上,比如智能网卡。
TYPE2类型支持CXL.io、CXL.cache、CXL.memory三种协议,可以应用在GPU、PGI的加速卡等。
TYPE3类型支持CXL.io和CXL.memory,实现memory内存和容量的扩展。
从业界已经落地的产品来看,TYPE3类型最多,重点是要解决存储的带宽和容量的问题。
TYPE3类型在系统中如何应用?对于传统的系统来说,一个服务器里面有CPU,有DRAM的内存模组,相当于是一个CPU可以访问自己独立的内存模组,但是整个存储容量和带宽是有限制的,内存负载也不能更好的分配。当服务器的负载高的时候可能内存不够,低的时候空闲内存又是浪费,一个CPU对于配套内存的独立访问,不能实现内存共享。
基于这个问题,紫光国芯采用CXL TYPE3的设备,首先可以插在panel上实现内存的扩展。另外一个很大的优势,比如以CXL2.0和3.0的设备实现内存的池化或者fabric,这样可以多个CPU共享内存,有的内存负载轻,有的内存负载高,通过CXL协议来实现均衡,提升系统内存的利用率,降低TCO。
从整体实现的成果来看,通过CXL的memory TYPE3设备可以在原来基础上实现整个系统内存带宽和容量非常好的扩展。
紫光国芯的CXL布局
紫光国芯在CXL技术方面有着全面的布局。2019年这项技术发布,紫光国芯一直紧密关注CXL技术演进和产业生态的发展,积极布局相关产品,并于2021年启动了CXL相关产品的研发工作。2022年公司正式发布了CXL产品路线图,2023年,完成了CXL相关产品样品的客户送样。今年,我们的CXL产品已在客户端实现成功导入,未来还会发布更多CXL相关的产品。
紫光国芯当前的CXL产品主要针对内存扩展方案,提供主控芯片或模组部件方案。介质可以支持非易失性内存(PCM)介质和DRAM介质。
支持PCM介质的是SCM设备,可支持128GB到2TB的存储容量,基于CXL2.0的协议标准,支持PCIe Gen5 X8/X4的物理层,对外接口带宽与PCIe Gen5速率一样。目前正在送样,预计明年Q3量产。
支持DRAM介质的产品控制器芯片可支持64GB到2TB的存储容量,也是基于CXL2.0的协议,支持PCIe Gen X16/X8/X4的接口形态,目前也在送样阶段,预计明年年底量产。
目前,紫光国芯积极布局下一代产品,已经规划基于CXL3.x协议的控制器芯片,对应的物理层接口是PCIe Gen6,进一步提升性能。
今天峰会上,紫光国芯还设有专门的CXL产品的展示区,欢迎大家到展台参观交流。
以上便是紫光国芯关于用CXL设备实现服务器内存的容量及带宽扩展的分享,感谢大家的关注和支持!