在2018年全球超算大会上,戴尔易安信宣布在高性能计算部署和新产品组合扩展方面的最新进展,旨在帮助人工智能、生物科学、天气预测等各个科研领域加快获得洞察。戴尔易安信还宣布佛罗里达大学的空间、高性能和弹性计算中心(SHREC)荣获2018年戴尔易安信人工智能挑战赛的冠军。
戴尔易安信副总裁兼HPC总经理Thierry Pellegrino表示:“IT技术的不断优化使HPC系统拥有更强大的性能和创新力,以加快对科学的探索,但仍有很多人认为实施过程很复杂。基于数十年来与领先的机构、技术合作伙伴和战略客户的合作经验,戴尔易安信提供了广泛的可简化HPC部署的技术组合,从而推进科研工作和HPC的普及。我们始终致力于引领HPC的创新,并帮助所有类型和规模的组织机构进一步推进和扩展人工智能与机器学习领域的机会。”
戴尔易安信支持推动人类进步的科研工作
戴尔易安信长期处于推动客户采用最新HPC技术的一线,以大力推动广泛的科学发现和研究工作。近期诸多客户的动态也印证了戴尔易安信提供世界级HPC系统的承诺,这些系统融合了服务器、加速器、液冷和网络领域的最新提升:
——德州大学奥斯汀分校的德州高级计算中心(TACC)选择与戴尔易安信合作,开发将于2019年交付的全新Frontera超级计算机,该项目获得了来自美国国家科学基金会的六千万美元奖金资助。截至2018年8月该消息发布时,Frontera的完成将使之成为全球第五强大的超算系统,其速度在美国排名第三,并且也将是所有大学中规模最大的系统。戴尔易安信PowerEdge系统将整合多项技术创新,例如CoolIT Systems高密度直接接触式液冷散热、高性能Mellanox HDR 200Gb/s InfiniBand互联以及下一代英特尔®至强®可扩展处理器。
Frontera的早期项目计划包括欧洲核子研究组织(CERN)大型强子对撞机的粒子碰撞分析,以及全球气候建模、飓风预测、多信使天文学等。
——剑桥大学已经通过其“Cumulus – 英国科学云”项目扩展了超级计算能力。这个新的OpenStack系统是英国最大的学术超级计算机,采用搭载英特尔®至强®处理器和英特尔® Omni-Path架构的戴尔易安信PowerEdge服务器,其性能可达每秒超过2千万亿次浮点运算。为了帮助解决英国最具挑战性的数据驱动型、模拟及人工智能任务,由剑桥大学、戴尔易安信与StackHPC(一家致力于HPC和云融合的英国初创公司)合作提供的Cumulus面向英国学术界和各行各业开放。该项目已获得来自英国科学与技术设施委员会(DiRAC/IRIS)、英国工程和自然科学研究委员会(Tier 2)和剑桥大学超过1,300万英镑的总投资。
——密歇根大学正在部署Great Lakes计算集群,用于模拟、建模、人工智能、机器学习、数据科学、基因组学等等。这个新系统采用了基于戴尔易安信PowerEdge服务器的HPC基础设施。Great Lakes是业内第一个受益于Mellanox HDR 200Gb/s InfiniBand网络的系统,实现了更快的数据传输速度和更高的应用性能。
——俄亥俄超算中心正在部署戴尔易安信提供的Pitzer集群。就像德州高级计算中心的Frontera系统,Pitzer集群将利用戴尔易安信PowerEdge服务器以及CoolIT的模块化、机架式直接接触液冷散热解决方案来获得更高的机架密度、更强的组件性能潜力和更佳的能效。因此,它能呈现出接近该中心最强大的集群的性能,但能耗较低,而且只占用不到其一半的空间。该系统将用于广泛的科研领域,从人类基因组学到病毒的全球传播。
戴尔易安信通过增强就绪解决方案来简化HPC的采用
目前,HPC工作负载需要存储基础设施不断地扩展,并提供卓越的带宽和高并发能力,才能推动深度学习算法和人工智能的发展。为了满足这些需求,戴尔易安信致力于扩展其HPC产品组合以提供广泛的高性能存储选项,凭借通过基于Isilon OneFS操作系统的戴尔易安信Isilon横向扩展NAS存储进一步完善就绪解决方案产品组合。
戴尔易安信HPC Lustre存储就绪解决方案和戴尔易安信HPC NFS存储就绪解决方案目前可通过戴尔易安信PowerVault ME4存储阵列购买。戴尔易安信PowerVault ME4系列配备比PowerVault MD3多75%的驱动器,并将原始存储容量提高了122%,同时将IOPS读取性能提高了四倍。此外,其模块化设计可实现对设备进行灵活、自定义的定制,凭借更高的存储密度,其规模也能够随着客户的业务扩张而进行扩展。
基于PowerVault ME4的戴尔易安信HPC Lustre存储就绪解决方案非常适合技术性大数据应用,通过动态存储扩展,使每个构建模块都拥有出色的吞吐量。作为一个针对HPC环境进行了优化,同时易于使用且完全冗余的NFS存储解决方案,基于PowerVault ME4的戴尔易安信HPC Lustre存储就绪解决方案是一款提供更高整体性能和密度的解决方案。这两种解决方案都已配备戴尔易安信全球服务和支持。
戴尔易安信PowerEdge服务器强力支持最新的加速器技术
戴尔易安信PowerEdge R640、R740、R740xd和R7425服务器将支持最新的GPU和FPGA加速器,以加速数据分析和人工智能解决方案,包括:
——NVIDIA Tesla T4是一款适用于分布式计算环境的通用人工智能加速器,它位于一个高能效的70瓦小型PCIe外壳中。英伟达表示Tesla T4为训练和推理提供比传统CPU高几倍的性能,性能表现十分突出。通过NVIDIA TensorRT和cuDNN软件库以及与所有人工智能框架的集成,开发者可以释放基于 NVIDIA Turing架构的Tensor Cores的威力。
——从视频直播到金融服务,乃至国防应用,FPGAs让硬件可以为优化进行编程和重新编程。目前,除了支持英特尔 Arria 10 GX FPGA以外,戴尔易安信将Xilinx Alveo U200 加速卡纳入其PowerEdge服务器加速器选项,成为第一家支持这款加速器的服务器厂商。Xilinx表示,Alveo加速器可以为机器学习提供比只采用高端CPU高20倍的实时推理吞吐量。
戴尔易安信人工智能挑战赛冠军
佛罗里达大学空间、高性能和弹性计算中心(SHREC)的一支研究团队被戴尔易安信评为2018年戴尔易安信人工智能挑战赛冠军。戴尔易安信于2018年5月推出的这项人工智能挑战赛鼓励参赛者展示人工智能的实际应用,这对企业、科研以及社会都有着革命性的影响。冠军得主获得了在戴尔易安信HPC与人工智能创新实验室Zenith集群上的20万个核心小时,其项目也在2018年超算大会戴尔易安信展台上作为亮点展出,并参与到一系列推广活动当中。
佛罗里达大学空间、高性能和弹性计算中心(SHREC)由30多个行业、政府和学术合作伙伴组成,共同解决在通过重新配置、可靠的高性能计算来驱动或改进任务和应用上所面临的科研难题。对于此次人工智能挑战赛,SHREC团队开发并展示了一个异构计算(HGC)系统,该系统可以支持完整的机器学习工作流,包含数据分析以及预处理、模型训练、部署和推理,并适用于任何利用机器学习的应用领域,包括医疗、商业、金融、科学探索等等。
该团队的学生代表Chao Jiang博士表示:“为了这次人工智能挑战赛,我们的团队利用了CERN OpenLab数据集来确定HGC工作流的性能,包括将CPU、GPU和FPGA用于机器学习。研究表明,性能提高了1.45到2.22倍。这些早期的研究成果为我们提供了很大的帮助,我们正计划继续测试基于更复杂的3D图像的技术,例如利用3D U-net技术进行立体分割来帮助提高性能,以及用于加速例子模拟的3D GAN。”
供货信息
基于PowerVault ME4的戴尔易安信HPC Lustre存储就绪解决方案以及基于PowerVault ME4的戴尔易安信HPC NFS存储就绪解决方案即日起上市;戴尔易安信PowerEdge R640、R740、R740xd和R7425服务器计划于2019年第一季度支持NVIDIA Tesla T4 Tensor Core GPUs,并于2018年12月支持Xilinx Alveo U200加速卡。
客户引述
“Frontera是我们与戴尔易安信合作部署的第三个Top 10和第五个Top 25超算系统。我们共同取得的成功离不开双方密切的深度合作,和对于每一个细节的关注,这让我们可以按时且在预算内不断地发展尖端技术。通过这台新设备,我们将进一步拓展科学研究的边界,为研究人员提供具有突破性强大功能的设备。”
——德州大学奥斯汀分校德州高级计算中心(TACC)执行主任Dan Stanzione
“传统HPC集群技术提供预配置的静态资源池,能够在很大程度上满足数量有限但非常重要的用户群。通过实现云模式,包含在裸机环境中,软件定义基础设施的优势在于包含传统HPC集群,无需牺牲性能,并在支持现代混合云工作负载方面提供更高的敏捷性。我们看到此类新工作负载的用户大幅增长,而Cumulus让我们的用户可以在安全且灵活的环境中更轻松地进行HPC和HPDA级计算。与戴尔易安信等合作伙伴携手,我们打造了英国计算能力最强、I/O效率最高的资源之一。”
——Paul Calleja,剑桥大学高性能计算主任
“我们很高兴与戴尔易安信合作。Great Lakes用户将能够访问更多运行更快的核心,以及更快速的内存、存储和更加平衡的网络。这个新集群将为密歇根大学的科研人员提供更高的性能、灵活性和可靠性。”
——Brock Palen,密歇根大学先进科研计算-技术服务(ARC-TS)部主任
“我们与戴尔易安信一起打造了Pitzer集群,这是一个高效、高密度且灵活的petaflop级系统。通过将这个宝贵的集群增加到我们的数据中心,使俄亥俄超算中心得以继续满足我们的学术、科学和行业客户社区对计算、存储和分析越来越高的需求。”
——David Hudak博士,俄亥俄超算中心执行主任
“精准医疗的重点之一是能够分析人类基因组,找到异常,然后进行有针对性的治疗。来自多个来源的数据集非常庞大,我们必须依赖人工智能才能合理地利用这些数据。戴尔科技集团是我们推动科学进步至关重要的合作伙伴,戴尔易安信Isilon为我们提供了一个简单的横向扩展解决方案来管理和处理PB级的数据,帮助基因组将处理时间从几周缩短到几个小时。对于拯救生命的科研来说,每分每秒都很重要,我们信任戴尔易安信。”
——James Lowey,TGen首席信息官