近年来,AI的兴起为HPC开启了新的应用领域。HPC积累多年的多机并行、高速低延迟网络、管理调度算法等成熟技术大大减轻了管理使用AI集群的负担。但在实际环境中, 由于AI和HPC在工作负载、编程模型以及开发应用等方面存在诸多差异,如何实现资源的整合利用,有效避免资源浪费,已成为AI HPC用户共同面临的挑战。浪潮认为,需要从计算性能、可扩展平台架构,以及系统优化设计等方面进行优化和重构,才能有效解决AI与HPC融合应用带来的新挑战。
浪潮发布的AI HPC融合一体机,集成了最新的计算技术与优化软件,可通过容器化部署的软件堆栈和灵活的节点设计,高效支持AI和HPC的不同工作负载运行在同一个计算平台上,加速AI HPC研发与应用创新。
浪潮AI HPC融合一体机计算节点采用i48高密度多节点服务器,可以在4U空间支持16颗英特尔最新的Cascade Lake处理器和Omni-Path高速网络。集成了高效的Intel AVX-512高级矢量扩展和深度学习增强指令集,可针对不同的HPC与AI工作负载,提供高密度、均衡计算、大容量存储等多种类型节点的混合部署方案,敏捷适应不同负载对计算、网络、存储的差异需求。最新的Intel Xeon Cascade Lake处理器集成了DL Boost深度学习增强技术,AI性能比上一代至强处理器提升14倍。
在软件堆栈上,浪潮AI HPC一体机集合了浪潮AI开发平台AIStation、Teye应用特征分析工具,提供涵盖数据处理、模型开发、模型训练、资源调度等场景的一站式平台解决方案,实现对计算资源的统一管理、监控及调度,有效提升计算效率,为AI计算释放澎湃算力,助力研发人员和数据科学家快速开展深度学习网络模型的构建、训练工作。同时,内置基于Intel架构优化的主流AI框架,如基于Python的Optimization for TensorFlow可加强现代深度神经网络的易用性和可扩展性,Optimization for Caffe是最为流行的图像识别框架之一,Intel MKL函数库提供对MXNet深度学习框架的内置支持等。
浪潮集团副总裁彭震表示:“当前,人工智能与高性能计算相互融合正在重新定义IT基础设施,硬件重构+软件定义的融合架构将成为未来最重要的计算范式之一。浪潮希望通过AI HPC融合一体机的创新,为全球高性能计算和人工智能用户提供兼具灵活与高效的统一计算平台,实现在科学计算和人工智能计算两类不同却联系密切的工作负载之间灵活切换。”
英特尔全球副总裁、企业和政府事业部总经理Rajeeb Hazra表示:“传统HPC与AI的融合代表了计算领域巨大的范式变化。通过与浪潮这样的创新者合作,我们将为科学家和研究者提供他们需要的工具,以应对世界上最大的计算挑战。”