——浪潮高性能“天、地、人”系列案例(一)
在全球气候变暖的背景下,强暴雨、强对流、高温、干旱等极端的天气气候事件正在呈现增多的趋势,迫使人们不得不重视极端天气气候事件的预报、预测和灾害的防御。这种变化给大气研究带来了新的挑战,需要更高的科技水平和科技手段来提高对灾害天气的监测和预警能力。
在极端天气气候事件的研究中,预测无疑是非常关键环节,以龙卷风为例,如能对龙卷风的产生地点、走向、持续时间以及影响范围等做出准确预测,就能提前做好避险、迁移等工作,将人员和财产损失降到最低。目前,美国已经可以做到提前13分钟到15分钟来发布龙卷风的预警,这也成为美国气象现代化的标志。
1比16,天气预测精度和超算性能之间的博弈
一般来说,天气预报的准确度依赖于气象数值模式的分辨率。分辨率的数值是指该模式能预测多少范围内的天气变化,分辨率的数字越小表示能预测的范围越精细,越能为突发天气灾害、百姓日常出行提供准确的天气依据。南京大学大气科学学院近日承担了多项科技部973项目、国家基金委重点研究项目,其中一项就是中尺度灾害性天气机理研究和数值预报的高时空分辨率数值模拟,以及支撑全国3km高分辨率的实时数值预报研究系统,这种分辨率水平在国际中处于领先地位。
南京大学大气科学学院是我国最早建立的气象学系,在中尺度天气、边界层气象、大气环流与季风、短期气候变率与预测等领域取得了具有国际影响和富有特色的研究成果,多次获得省部级科技奖和国家科技进步奖。
南京大学大气科学学院的专家介绍,“国内大部分气候模式的分辨率都在1-3KM左右,国外如美国已经能开展500米甚至200米的精度的预测,要赶上欧美国家的水平需要强大的超级计算机支撑。然而,天气预报对计算性能需求巨大,分辨率越高越需要计算性能强大的超级计算机。理论上来说,预报精度提高1倍,其所需计算量将提高16倍。”
软、硬“两仪”,浪潮高性能方案化解计算挑战
一元生两仪是对中国智慧的高度总结。针对南京大学大气科学学院的需求,浪潮的解决方案颇有点“一元生两仪”的意味,所谓一元指浪潮方案的一体化,所谓两仪分别指浪潮一体化方案中的硬件方案和软件方案。
在南京大学大气科学学院的气象研究模式中,基本采用WRF、ARP等模式。这些模式对计算性能的需求非常大,并且运行这些软件时,各个CPU之间的通讯量也很大。同时,由于涉及大量的用户和大量的小文件读写,气象模式基本都对整个系统的IOPS性能都有较高要求。
在软件的应用层面,浪潮高性能一贯提倡深度挖掘行业应用,不仅拥有一支高性能专业应用研究团队,同时还不断收集、积累各行业应用软件,并进行深入测试、分析、整理,形成自己一套高性能应用特点剖析方法论。在南京大学大气科学学院的项目中,浪潮专业应用团队对用户的需求进行了该方法论中的“单元测试”和“基准测试”,对用户的应用需求进行了充分、完整的评估,然后根据评估出的数据为用户量身定做了硬件层面的系统构建方案。
浪潮针对WRF应用做的评估测试
在硬件层面,浪潮根据气象行业的应用特点,为南京大学大气科学学院设计构建的超级计算机采用浪潮NF5280M3作计算节点,并配合光纤存储系统浪潮AS500E,实现了所有节点全线速、无阻塞高速互联,整系统的Linpack实测效率达到92%以上。此外,在高带宽、大容量外,存储的数据安全性越来越成为现在集群建设的一大难点,为此浪潮部署了一套并行文件系统,实现多节点的高可用,通过8Gb光纤网络映射到后端存储,保证单个节点宕机不影响系统正常读写到磁盘阵列。同时,考虑到气象领域对存储空间的需求,浪潮还为该集群配置了超800T裸容量的光纤存储系统,可以充分满足大气科学院近三年存储需求。
据悉,浪潮构建的这部超级计算机使南京大学大气科学学院的气候数值预报更精细化,目前WRF模式测试后可以开展1公里级的天气模拟和10公里级别的短期气候模拟;CESM全球模式则能进行1X1度左右的高分辨率全球模拟。
中国厂商具备世界级系统构建能力 浪潮实力受肯定
在南京大学大气科学学院的教授看来,将项目交给浪潮让他们放心。“浪潮曾参与设计构建天河2号超级计算机说明浪潮具备世界级系统构建能力,同时我们也了解到我国高校最快超级计算机、我国高校第一台百万亿次超级计算机都是浪潮设计构建的,这说明浪潮具备成功的落地项目经验、了解高校用户的切身需求,同时浪潮具备吉林省气象局、南海海洋研究所等气象领域的丰富案例,这说明浪潮具备丰富的气象行业应用经验。”
据了解,浪潮设有超百人的HPC服务团队,拥有超过10年的应用调优经验、覆盖10个以上行业将近300个应用软件数据库,能够提供HPC方案选型、应用需求分析、系统架构设计、专用产品技术验证等专业级应用服务,并且在MIC、GPU等异构计算的应用开发、应用移植方面也具备丰富的经验。