数据存储产业服务平台

AI就是高性能计算

SUN说:网络就是计算机。

联想说:AI就是HPC(高性能计算)。

抱歉,联想没有说。这是小编总结的。

尽管联想没有明确这样说,但在8月31日举行的2018联想全球超算峰会上,联想对外发布了全新AI产品家族,将HPC、AI紧紧关联在一起。

这也是AI就是HPC的灵感来源

早已经是产业共识

AI就是高性能计算,这已经是产业界的共识。

但以小编知识结构,其实一时转不过来,没有领悟其中的奥秘。

HPC为AI提供了计算引擎,大数据为AI提供了数据引擎;反过来,AI、大数据给HPC带来了新的业态。”这就是结论。

如何理解这个结论呢?

先说说AI,如今AI有泛化的趋势,无助于人们的理解。

简单说,这一波AI浪潮的兴起和深度神经元网络和机器学习有关。AlphaGO就是最初的表现。其中最关键的技术是以大数据处理为基础的机器学习,对于算法模型的不断调优,从而使得其具备智能判断、分析的能力。

说到AI,很容易和人脸识别、语音识别、步态识别等具体技术联系在一起。

但实际上,AI分为重型AI和轻型AI。

其中,轻型AI在消费级产品领域应用比较快,更加容易被人们所熟悉,例如AI手机,如摄影模式的智能判断和选择等

轻型AI的特点是针对目标硬件进行裁剪,可以通过硬件固化,如AI芯片,来实现秒级处理的效果。

但对于重型AI来说,体现出来的特点就是大数据、大模型和多任务。其模型训练需要大数据和大机器,其中HPC首当其冲。追求的是高吞吐率的智能推理以及复杂的关联关系分析。

简单说,当今的AI可以理解为算法、机器学习和人工经验的结合,是基于数据和结果,对于控制参数进行调优的结果。

绕不开的GPU话题

谈到AI,GPU是一个绕不开的话题。

实际上,不仅是GPU,围绕着复杂繁多的AI应用场景,如今GPU、TPU、HPU、BPU、IPU、NPU、VPU、XPU等百花齐放。几乎26字母都已经被用到。

原因很简单,没有任何一款通用处理器或者芯片可以满足所有AI应用场景的需要。

似乎这些和HPC无关。

说到HPC,离不开Top500排行,以Link Pack测试性能指标为前提的排行。

HPC、超级计算机的性能被誉为一个国家科技实力象征,王冠上的明珠。

中国在Top500排行榜上取得了突破性的进展,天河2号和神威太湖之光连续6次和4次拿到了冠军,连续5年占据榜首。今年,才刚刚被美国Summit超过,行内人透露,用不了多久,也许就是半年之后,就会被国产机超过。

这个成绩是怎么取得的呢?

答案就是抓住了“异构并行计算”的机会。其中,GPU、FPGA和APU功不可没,从百万亿次,千万亿次,都是靠这样的一个技术。

HPC接下里的目标是E级计算,靠“异构并行计算”,靠花钱是没有办法突破E级计算的,接下来要面临“访存墙、通信墙、可靠性墙、能耗墙、并行计算可扩展性”等一系列难题。

简单说就是互联、网络、可靠性和功耗。

E级计算有用吗?

除了象征意义之外,计算能力也是非常重要的。

诺禾致源高级副总裁吴俊

在采访中,诺禾致源高级副总裁吴俊表示,作为一家开展基因测序服务和研究的公司,从测序仪产生的海量数据处理,到最终结果的分析判定,都需要强大的数据处理能力。

此前,1台基因测序仪产生的数据量是200GB~300GB,如今已经快速发展到6TB,时间也从7天~8天,缩短到2.5天。基因测序的成本,也从1万人民币暴跌到1000元左右,具备了商业化应用的前景。

HPC计算性能的提升,显然有助于服务流程的优化,快速相应需求。但是与此同时,也要根据商业模式选择合理的方案,没有办法无限制的追逐高性能。

相比于性能,诺禾致源更加看重的可靠性、稳定性以及节能的水平。联想在温水冷却等节能技术上独树一帜,在IBM x86服务器的基础上,有很多读到技术和可靠性、稳定性保障,这也是他们选择联想高性能计算的原因。

吴俊表示,现有基因测序分析软件并不适用于GPU。但在AI助力方面,HPC的计算能力、数据处理能力仍然是可以信赖的基础。

联想数据中心业务集团制造行业总监许子牛表示:HPC助力AI是一个方面,另外AI也可以助力HPC,例如能耗问题,访存效率的提升,都可以借助AI技术。这对于E级计算机的实现,也具有重要意义。

即使对于E级计算,“异构并行计算”仍然是首选的技术,各种XPU加速技术也有助于目标的实现。

未来的HPC不仅针对科学计算,将同样适用于大数据、AI的应用场景,这将会是一个应用领域兼顾的过程。

本次联想全球超算峰会,联想发布自主研发的AI产品家族:ThinkSystem SR670、ThinkSystem HG680、ThinkSystem HG690共3款产品,其实是HPC、AI优化的结果。联想还推出第三代温水水冷解决方案“海王星”系统,其中包括Direct-to-Node温水水冷技术、后门热交换器、以及由空气和液体冷却组成的混合冷却技术,使数据中心的运行效率提升高达50%。

这就是联想接地气的结果。

在本次峰会上,联想没有披露更多E级计算机进展,但其并不遥远。

小结

AI技术思路的突破,正在颠覆、改变就有的格局。以HPC为例,也在从科学计算、工程计算,渗透到大数据和AI,HBM (High Bandwidth Memory)、XPU、3D NAND、Optane等新技术产品的出现,也会极大改变现有的商业格局。

世界正在快速变化中,HPC当然也不例外!

未经允许不得转载:存储在线-存储专业媒体 » AI就是高性能计算