近日,笔者获悉某植物研究所为了开展的基因组学、种质资源、新药创制、 生命条形码等核心工作,建设西南战略生物资源超级计算分中心,中心建立10万亿次超级计算机群,打造我国西南地区生物研究中心。中心以曙光天演EP850-GF2服务器和曙光CB85-F四路刀片构建高性能计算集群系统,在性能和专业应用上满足了研究所的需求。下面我们就这一生物研究领域超算应用的典型案例作出说明:
首先谈谈硬件方案,植物研究所高性能计算集群硬件系统包括计算子系统、存储子系统、网络子系统、管理诊断子系统、接入子系统以及基础架构子系统五个部分,系统整体架构如下图所示:
植物研究所高性能计算机群是一个具有海量存储能力和超级计算能力的高性能计算环境,包括登录结点池、计算资源池以及存储资源池等。
高性能计算用户可以利用WEB、应用集成GUI以及Scripts三种方式连接到集群登录结点提交作业,并通过全局共享的并行存储资源池存储应用程序的输入文件和输出结果:
由于生物研究的特殊性,机群的整体安全性和可管理性非常重要,所以,集群采用的曙光DCSM机群安全模块源于智能防火墙技术,其核心思想是为机群系统的使用增加一道管理屏障。DCSM专门针对机群按进行了优化,在软件设计上增强了机群系统的接入控制和安全管理功能,使之与机群产品有机结合,从而更好地发挥机群网络安全门户的作用。
访问控制:非法用户无法入侵,不批准连门您都摸不着。
安全隔离:外网病毒、木马、以及入侵等恶意行为可以安全过滤防护。
节点映射:可以在安全的情况下与外界进行数据交互,如在线下载补丁包,上传特定数据。
远程安全接入:可以从远程拨号接入分中心,即使通过互联网络也可以安全地访问和管理机群。
安全管理:机群安全模块为机群增加了一个有效的网络安全策略管理的平台,提高机群应用的安全性。
日志统计:对任何进入机群节点的操作以及DCSM系统相关配置,都有详细的日志统计、审计,日志结果可按照IP、时间、流量等相关元素排序、统计、查询等操作,也可以报表、文本等多种格式输出。
除了安全性能,在散热设计上为了满足植物研究所超高密的系统散热要求,服务器内部设计了多处专用散热通道,每个通道保障不同部件的散热。通过独立散热通道,对部分发热量的部件形成隔离空间,强制形成前后空气对流,避免对周围部件的散热影响。
植物研究所采用的曙光CB85-F服务器,EP850-GF2服务器作为计算结点,峰值性能为10.3Tflops。
CB85-F是最新研发的新一代刀片式服务器产品,并专为HPC进行优化设计,单结点linpack效率超过85%。四颗处理器通过AMD Hypertransport总线直接实现互联,互联带宽高达8GB/s。每个处理器通过集成的内存控制器访问四通道内存系统,能够极大的满足研究所的运算需求。
植物研究所超级计算机群系统具备业界顶尖的管理、诊断系统设计。全新管理平台包括内嵌于服务器结点的高集成度服务器硬件控制单元、机柜智能监控系统以及功能全面的管理软件系统Gridview和PowerConf(曙光研发的服务器专用管理软件),如下图所示:
曙光Gridview v2.0服务器综合管理系统统一告警平台系统图示
植物研究所在应用中测试发现,使用曙光Powerconf节能,效率能达到20%左右:
植物研究所采用的10万亿次高性能计算集群系统占用5个机柜空间,考虑到未来一段时间的扩展需求,曙光还为研究所专门作了机房设计、配置和布局:
该植物研究所表示:西南战略生物资源超级计算分中心的建立,对我国植物及生物研究领域的贡献不可估量。感谢曙光高性能计算在生物研究领域多年来积累的丰富经验,正是出色的技术实力和行业经验的结合,解决了中科院某植物研究所的系统需求与实际应用的需求。