LHC计算网格(LHC Computing Grid)是一个国际性协作项目,包括网格网络连接35个国家的140个计算中心,旨在处理LHC实验中所产生的海量数据。CERN(欧洲核子研究组织)的LHC 所产生的数据流可达每秒300MB。
Enstore和dCache 是基于UNIX的存储应用,这两者构成了一个特殊的大规模存储系统来访问大量文件组成的大数据集。全球LHC计算网格的大量成员均使用这些应用来在全球数几十个站点进行数据的持续存储和分布。
挑战:dCache性能扩展
美国能源部(以下简称DOE)实验室的dCache环境也属于LHC 计算网格(LHC Computing Grid)的一部分,由多个存储池组成。每个存储池包含一个服务器和一对1GbE NICs。这两个1GbE NICs组成2Gbps通道连接入网。每个服务器还包括FC接口直连存储(DAS)。
DOE实验室的dCache应用可以将多个基于服务器的存储池当作一个存储系统使用,但是由于服务器上存在一个2GbE的吞吐量瓶颈,导致每个服务器的存储容量最多只能扩大到40TB。在使用QLogic解决方案之前,存储池容量虽然可以从40TB增加到180TB,但是通过2GbE连接传送数据的耗时之长远远超过了最终用户的忍受极限。为了缩短传送数据所花的时间,DOE实验室需要部署更多更小的存储池或是增加连接这些新的更大的存储池的带宽。此外,要实现dCache系统的自动扩展,就需要一个能够提供即时性能的解决方案,且无需系统定制或调优。
对于处在这个状况中的DOE实验室IT团队来说,很明显,使用10GbE NICs会简化系统设计,满足对更多网络带宽的需求,同时减少需要管理的网络适配器数量。
图1. dCache 存储池。随着存储池容量增长到180TB,存储服务器到网络的10GbE双连接成为瓶颈
解决方案
为了解决dCache应用的扩展性问题, DOE使用QLogic 智能以太网适配器将服务器连接升级到10GbE。QLogic 是一个值得信任的供应商,它为DOE实验室生产环境提供了FC技术。
结果
为了评估采用10GbE新架构的最佳总体解决方案,该实验室在生产环境下运行dCache存储应用来对不同厂商的10GbE适配器进行性能测试。虽然有很多产品能够满足基本要求,但该实验室更需要的是一个不需要调整的“开箱即用”的解决方案,这样将有助于使用生产环境中已有的dCache和Enstore应用传送PB级的数据。
鉴于QLogic FC主机总线适配器在现有生产环境的良好记录,DOE实验室将QLogic 3200系列智能以太网适配器作为10GbE网络升级设备之一来进行评估。在测试过程中,QLogic 3200系列智能适配器的即时性能卓越,达到8.9Gbps,超出其他配置性能达21%。
图2. QLogic 3200与其他10GbE 适配器的性能对比
凭借出色的40Gbps双端口吞吐量,QLogic 3200系列适配器也可让I/O密集型虚拟化环境从中受益。适配器的NIC分区(NPAR)技术允许用户将每个物理以太网端口划分成四个虚拟端口,并且可灵活、自定义地分配10Gbps端口带宽。
图3. dCache 存储池采用10GbE QLogic 3200系列适配器扩展存储池容量至180TB
DOE实验室已经在代理dCache环境下的存储服务器中部署了Qlogic 3200系列智能以太网适配器。在消除I/ O吞吐量瓶颈之后,dCache存储池容量突破了40TB的限制,每个存储池可以配置高达180TB。此外,不仅NIC的数量减少了一半,整个系统的管理也得到简化。