各种尖端科学,特别是高能物理这样既是基础科学同时又代表着一个国家科技实力、与国民经济和国防建设息息相关的前沿学科,历来都是世界各国重点发展的领域。中华民族在世界高能物理领域已经取得了卓越的成就。进入21世纪,在我们与世界高能物理强国学术交流不断加强的今天,高能物理面临着新的发展机遇,同时也面临着更多的新课题、新领域和新挑战。在这一高精尖的研究中,高性能计算系统成为科学家们必须的研究基础之一。
高性能计算与高性能存储 高能物理研究的基础
著名的华裔科学家丁肇中在谈到高能物理研究的时候,曾经这样形象地比喻:他发现陶粒子的工作量,就如同在北京的一场牛毛细雨中,寻找那唯一的一颗红色雨滴。这一比喻充分显现出现代高性能计算系统在现代高能物理研究中的重要性。随着高能物理研究的不断深入,高能物理研究对高性能计算工具的需求更是有增无减。西欧高能物理中心一台高能粒子对撞机每年所获取的数据,用100万台个人电脑的硬盘都装不下,而分析这些数据,则需要更强的计算能力。由高能物理研究以海量数据的精密分析为基础的特点所决定,高性能计算系统中高性能存储的重要性也日益突出。
采用浪潮高性能计算系统和高性能存储系统的山东大学高能物理研究在国内物理界享有盛名,其研究领域涵盖了加速器高能物理与高能宇宙线物理这两个目前高能物理界的核心研究领域。在这一领域,山东大学高能物理系担负着美、欧知名实验室和研究中心的多个项目。同时山东大学也参加了北京正负电子对撞机(BEPC)/北京谱仪(BES)合作组。在非加速器物理和粒子天体物理、高能宇宙线物理等领域,山东大学高能物理系还担负着多个计划。
对于这些目前物理界最前沿的研究项目,山东大学高能物理系对所采用的高性能计算系统有着相当高的要求。实际上,浪潮为山东大学高能物理系提供的高性能计算系统也成为山大完成众多科研项目的保障和基础。
全面解决方案 筑起迈向科学顶峰的阶梯
山东大学高能物理高性能计算解决方案拓扑图
与其他的高性能计算系统不同的是,用于高能物理研究的计算系统不但要像其他领域的应用一样,需要强大的数据运算、处理能力和高数据吞吐量,同时也对整个计算系统中的存储系统提出了更高的要求。因为在保证数据吞吐量和数据安全性的同时,高能物理研究中需要对大量数据进行频繁的调用,与其它存储系统中大部分数据在写入之后就很少调用的情况迥异。
浪潮在充分研究山东大学的需求之后,提出了上图所示的高性能计算系统解决方案。这套系统使用浪潮AS500活性存储系统与浪潮天梭10000高性能集群计算系统相配合,借助千兆以太网实现互联。
在山大项目中应用的天梭10000高性能计算系统总节点数量24个,其中包括18个计算节点;2个登陆节点;管理节点1台;2台文件服务器;1台安腾2开发服务器。系统峰值的计算能力达到268.8FLOTS。在这套系统中,还部署了Intel Vtune性能调优工具、Intel MKL数学核心库、Intel线程工具、Intel C++ 、Intel Fortran、JAVA编译环境、浪潮天梭管理软件、浪潮天梭监控软件、浪潮天梭集群部署软件。
与天梭10000共同构成整个计算体系的AS500是浪潮存储在活性存储技术战略指导下开发的新一代存储产品,具备高稳定、高性能、灵活扩展的特点。AS500采用完全模块化的设计思路,控制器、电源等主要部件采用冗余热插拔设计,很大程度上消除了单点故障引起的系统当机;而兼容FC和iSCSI两种主流主机接口的特性给用户提供了多种不同的配置选择,如FC SAN和IP SAN;在此次提供的方案中,客户选择了FC/iSCSI接口,其640MB/s的传输速度,4TB的存储容量,充分满足了高能物理海量数据处理的苛刻要求。
在充分考虑到山大高能物理研究计算的特点之后,浪潮特别为这一计算体系配置了两套AS500存储设备。在实际应用中,两套AS500各司其职,分别为登陆用户提供数据以及为计算项目保存运算结果,从而进一步提升了计算系统的整体性能,为整个系统的运作提供了更高的可靠性、可用性和可管理性。
这套高性能计算系统由于采用了全套的浪潮技术、产品和管理平台,有着令人满意的兼容性。在实际部署的过程中,浪潮还对整个系统的兼容性进行了国际标准的完善测试,充分保证了系统的高效、稳定。
目前,山东大学高能物理系的这套高性能计算体系已经就位,成为山大高能物理研究的基础。山大相关负责人表示:“高能物理系上下特别是研究人员对这套系统的表现非常满意。其性能表现、稳定性和可靠性足以和国外实验室中采用的系统相媲美。”