荷兰当地时间9月27日上午,OCP Regional Summit 2019在荷兰阿姆斯特丹举行。会上,百度与浪潮联合发布全球首款基于OCP OAI(Open Accelerator Infrastructure)标准和液冷的AI计算新品X-MAN 4.0。该产品可支持各类符合OAM(OCP Accelerator Module)规范的加速器,驱动AI计算平台对各类加速器模块的开放与融合。
X-MAN4.0整机柜最大可支持32个AI加速器构建的互联集群,它同时符合ODCC天蝎 3.0规范,支持液冷散热方式,适应大规模数据中心以整机柜的形式进行高密度、规模化部署。
百度超级AI计算平台X-MAN4.0
推动AI加速器技术的开放融合
OAI标准是OCP社区的一个技术小组,由百度主导并联合Facebook、微软等针对AI硬件加速模块和系统设计进行标准制定,计划开发OAI、OAM、UBB、HIB等9个开放技术规范,这些技术规范内容涵盖了结构设计、温度、管理、供电、硬件安全性、可用性等诸多方面,以促进不同AI加速器技术的开放融合,让AI计算平台设计更加敏捷,产业配套更为简化。目前,OAI小组已经公布了正式版的OAM标准,OAI-UBB(Universal Baseboard,通用基板)标准即将公布。
社区已经有数十个成员支持了OAI系列标准,包括百度、Facebook、Microsoft、Google等Tier1互联网运营商用户,以及Nvidia、Intel、AMD等AI加速器供应商,同时包括浪潮、IBM等计算方案供应商。
OAI标准得到广泛支持
百度副总裁侯震宇表示:“OAI标准将极大提高不同AI硬件加速模块和系统的互操作性,加速新AI硬件加速模块的大规模落地应用,全球AI硬件生态系统都会从中受益。”
浪潮集团高级副总裁王虹莉表示,OAI标准是AI计算产业变革的技术纲领,此次基于OAI标准的X-MAN4.0发布,让纲领变成现实。从技术规范到产业标准的升级是OAI发展关键,浪潮在这个过程中将发挥骨干作用,促进AI走向开放,赋能更广泛的AI客户和AI应用。
业界首款支持OAI标准和液冷散热的整机柜AI计算产品
此次X-MAN4.0采用了OAI系列技术标准,是百度超级AI计算平台X-MAN系列产品的第四代产品,单节点可以支持8个AI加速器,加速器之间采用8 port HCM(Hybrid Cube Mesh)互联架构,双向通信带宽高达56GBps,保证了AI加速器性能的发挥。在单个机柜层面,X-MAN4.0最大可支持32个AI加速器构建互联集群,具有极好的可扩展性。
X-MAN4.0同时符合ODCC 天蝎 3.0整机柜规范,高度为4SU(182.5mm),宽21英寸(536.0mm),长度850mm,支持风冷散热方式,也支持液冷,采用更高效的48V供电方式。
百度X-MAN系列产品多项技术行业领先,如X-MAN1.0首次实现AI计算硬件解耦架构、X-MAN2.0首次将冷板式液冷散热技术应用到AI计算产品里、X-MAN3.0首次倡导模块化标准化设计。此次百度将相关设计理念贡献到OCP并主导 OAI标准制定,并实现了首款支持OAI标准及液冷散热的AI计算产品。浪潮作为百度的重要合作伙伴之一,一直在参与X-MAN系列产品的研发和生产。
构筑融合的计算生态
开放计算2012年兴起,短短几年就成为重要的产业趋势,一个重要的原因就是开放计算各类标准得到了各个互联网运营商以及方案供应商的支持,完成了从技术规范向产业生态的升级。浪潮不仅是OCP成员、也是ODCC和Open19的成员,从贡献SPEC、参与开发标准到牵头标准制定,浪潮在OCS、Open Rack、天蝎等开放标准的产业化过程中都扮演了重要角色。
2019 OCP Regional Summit浪潮展区