生成式 AI 有望彻底改变它所触及的每一个行业 —— 掌握技术是迎接挑战的关键。
NVIDIA 创始人兼首席执行官黄仁勋发布了全新的 Blackwell 计算平台,并概述了计算能力的提升可为软件、服务、机器人技术、医疗技术等各个方面带来的重大进步。
“加速计算已到达临界点,通用计算已失去动力,”黄仁勋在硅谷巨大的 SAP 中心体育馆对其主题演讲观众说道。GTC 现场聚集了超过 11,000 名与会者,在线观众数以万计。
“我们需要一种全新的计算方式 —— 由此我们才可以继续扩展,继续降低计算成本,并在保证可持续性的同时继续进行越来越多的计算。与通用计算相比,加速计算使每个行业都可以大幅提速。”
黄仁勋站在网球场大小的 40 英尺高 8K 屏幕前,向挤满了首席执行官、开发者、AI 爱好者和企业家的人群发表演讲。
为了推动世界 AI 基础设施实现大规模升级的目标,黄仁勋发布了 NVIDIA Blackwell 平台,该平台具有对万亿参数大语言模型进行实时生成的能力。
黄仁勋介绍了 NVIDIA 推理微服务,即 NVIDIA NIM。这是一种全新的软件打包和交付方式,能够将开发者与数亿个 GPU 连接起来,以部署各种定制 AI。
黄仁勋还介绍了 Omniverse Cloud API,它可以提供先进的模拟能力,将 AI 引入物理世界。
演讲的尾声,黄仁勋进行了精彩演示,讲解了与一些大型企业的合作伙伴关系生态,还详细介绍了超过二十项发布来阐述其愿景,以此为 GTC 2024 的重磅发布画上了圆满的句号。
GTC 大会已经开展了 15 年,从最初在一个本地酒店宴客厅举办,到现在发展成了全球最重要的 AI 大会。本次大会是近五年来首次恢复线下。
今年的大会包含超过 900 场会议,其中包括由黄仁勋主持的有关 Transformer 的专家讨论会,批开发该技术的八位先驱们对话。此外,还有超过 300 个展示和 20 多个技术研讨会。
GTC 是一个几乎涉及所有领域的 AI 盛会。在开场致辞中,全球领先的 AI 艺术家 Refik Anadol 带来了惊艳的表演,展示了一座巨大的实时 AI 数据雕塑,屏幕上呈现着绿色、蓝色、黄色和红色的波动状旋涡,翻腾,交织和散落。
黄仁勋在演讲开始时解释说,多模态 AI 的崛起——能够处理由不同模型负责的多样化数据类型——赋予了 AI 更大的适应性和能力。通过增加参数,这些模型可以处理更复杂的分析任务。
但这也意味着对计算能力的需求显著上升。随着这些协作、多模态系统变得更加复杂(参数多达万亿),对先进计算基础设施的需求也随之增加。
“我们需要更大的模型,”黄仁勋表示,“我们将使用多模态数据来训练它,而不仅仅是互联网上的文本。我们将使用文本和图像、图形和图表来训练它,就像我们从电视中学习一样,它也需要从海量视频中学习。”
新一代加速计算
黄仁勋说:“我们需要更大的 GPU”。 Blackwell 平台就是为了应对这一挑战而构建的。他从口袋里掏出一块 Blackwell 芯片,将它与 Hopper 芯片并排举起,后者显得小了一些。
新架构以一位加州大学伯克利分校的数学家 David Harold Blackwell 而命名他门究弈和统计学,也是第一位入选美国国家科学院的黑人学者。新架构超越了两年前推出的 NVIDIA Hopper 架构。
Blackwell 在单芯片训练方面的 FP8 性能是其上一代架构的 2.5 倍,在推理方面的 FP4 性能是其上一代架构的 5 倍。它具有第五代 NVLink 互连,速度是 Hopper 的两倍,并且可扩展至 576 个 GPU。
NVIDIA GB200 Grace Blackwell 超级芯片通过 900GB/s 超低功耗的 NVLink 芯片间互连,将两个 Blackwell NVIDIA B200 Tensor Core GPU 连接到 NVIDIA Grace CPU。
黄仁勋举起一块带有系统的电路板说道:“这台计算机是同类计算机中的第一台,能够在这么小的空间容纳如此多的计算量。由于它的内存是连贯的,感觉就像个幸的大庭一开发个应用程序。”
为了获得最高的 AI 性能,基于 GB200 的系统可以与今日发布的 NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X800 以太网平台连接,这些平台可提供速度高达 800Gb/s 的高级网络。
“这样我们可以大量地节省能源、网络带宽量和时间。”黄仁勋表示,“未来将是可生成的,这就是为什么这是一个全新的行业。我们的计算方式有本质差异,所以 NVIDIA 为生成式 AI 时代打造了一款全新处理器。”
为了扩大 Blackwell 的规模,NVIDIA 构建了一款名为 NVLink Switch 的新芯片。每个芯片可以以每秒 1.8 TB 的速度连接四个 NVLink,并通过减少网络内流量来消除流量拥塞。
NVIDIA Switch 和 GB200 是黄仁勋所称的 “一个巨型 GPU” ,也是 NVIDIA GB200 NVL72 的关键组件。NVIDIA GB200 NVL72 是一种多节点、液冷、机架级系统,利用 Blackwell 为万亿参数模型提供强力计算,在单个机架中可实现 720 petaflops 的 AI 训练性能和 1.4 exaflops 的 AI 推理性能。
该机器包含 600,000 个零件,重 3,000 磅。黄仁勋在介绍此台机器时说道:“此时此刻,地球上也许只有三台百亿亿次浮点运算机器。而这是一个单一机架中的 1 个亿亿次浮点运算 AI 系统。”
此外,NVIDIA 还推出了更强大的新一代 AI 超级计算机 —— 由 NVIDIA GB200 Grace Blackwell 超级芯片提供支持的 NVIDIA DGX SuperPOD,可用于处理万亿参数模型,并具有持续的正常运行时间,以实现超大规模生成式 AI 训练和推理工作负载。
全新 DGX SuperPOD 采用新型高效液冷机架规模架构,采用 NVIDIA DG GB200 系统构建,可在 FP4 精度下提供 11.5 exaflops 的 AI 超级计算能力和 240 TB 的快速内存,并可通过额外的机架进行扩展。
“未来,数据中心将成为 AI 工厂”,黄仁勋说,“AI 工厂的使命是创造收入,同时也创造智能。”
Blackwell 已经受到了各行各业的欢迎,并获得多个行业领导者的支持,其中包括Alphabet 及 Google的首席执行官 Sundar Pichai,Amazon 首席执行官 Andy Jassy,Dell 首席执行官 Michael Dell, Google DeepMind 首席执行官 Demis Hassabis,Meta 首席执行官 Mark Zuckerberg,Microsoft 首席执行官 Satya Nadella,OpenAI 首席执行官 Sam Altman,Oracle 董事长 Larry Ellison和Tesla和xAI 首席执行官Elon Musk。
Blackwell 正在被全球各大云服务提供商、领先的 AI 公司、系统和服务器供应商,以及世界各地的区域云服务提供商和电信公司所采用。
“整个行业都在为 Blackwell 做准”,黄勋表示。
创造软件的新方式
黄仁勋表示,生成式 AI 改变了应用程序的编写方式。
他解释说,未来的公司会将精力放在组装 AI 模型,赋予它们任务,给出工作产品示例,审查计划和中间结果,而不是编写软件。
NVIDIA NIM 软件包是根据 NVIDIA 的加速计算库和生成式 AI 模型构建的。
“未来我们如何构建软件?你不太可能从头开始编写,也不太可能写一大堆 Python 代码或类似的东西,” 黄仁勋说,“很可能你只需要组建一支 AI 团队够了。
这些微服务支持行业标准 API,易于连接,可在 NVIDIA 庞大的 CUDA 安装基础上工作,针对新 GPU 进行重新优化,并不断扫描安全漏洞和威胁。
黄仁勋表示,客户可以使用现成的 NIM 微服务,或者 NVIDIA 可以为之构建专属的AI 和 AI 助手,为特定公司所需的模型专业技能提供专门训练,以助力您创建宝贵的新服务。
“企业IT行业正坐在一座‘金矿’上,”黄仁勋说道, “他们拥有多年来创建的所有这些令人惊叹的工具(和数据)。如果他们能把这个‘金矿’变成 AI 助手,就能给用户提供更多可能。”
领先的科技公司已经开始行动。黄仁勋详细介绍了 NVIDIA 何帮助 Cohesity、NetApp、SAP、ServiceNow 和 Snowflake 构建 AI 助手和虚拟助理。各行各业也在纷纷加入行列。
在电信领域,黄仁勋宣布推出 NVIDIA 6G 研究云,这是一个由 AI 和 Omniverse 支持的生成平台,旨在推动下一个通信时代的发展。它采用 NVIDIA 的 Sionna 神经无线电框架、NVIDIA Aerial CUDA 加速无线电接入网络和 NVIDIA Aerial Omniverse Digital Twin for 6G 构建。
在半导体设计和制造领域,黄仁勋宣布,NVIDIA 正在与 TSMC 和 Synopsys 合作,将其突破性的计算光刻平台 cuLitho 投入生产。该平台将把半导体制造中计算最密集的工作负载加速 40-60 倍。
黄仁勋还宣布了 NVIDIA 地球气候数字孪生。该云平台现已推出,可实现交互式高分辨率模拟,以加速气候和天气预报。
黄仁勋表示,AI 的最大影响将体现在医疗领域,NVIDIA 已经涉足成像系统、基因测序仪器,并与领先的手术机器人公司合作。
NVIDIA 正在推出一种新型生物学软件。 NVIDIA 今天发布了二十多个新的微服务,使全球医疗企业能够在任何地方、任何云上利用生成式 AI 的最新进展。这些微服务可提供先进的成像、自然语言和语音识别,以及数字生物学生成、预测和模拟功能。
Omniverse 将 AI 引入物理世界
下一波 AI 浪潮将是 AI 对物理世界的学习,黄仁勋说。
黄仁勋表示:“我们需要一个模拟引擎,来以数字方式为机器人呈现世界,这样机器人就有了一个学习如何成为机器人的‘健身房’,我们称这个虚拟世界为 Omniverse。”
因此,NVIDIA 宣布将以 API 形式提供 NVIDIA Omniverse Cloud,从而将全球领先的工业数字孪生应用和工作流创建平台的覆盖范围扩展到整个软件制造商生态系统。
借助五个全新 Omniverse Cloud 应用编程接口(API),开发者能够轻松地将 Omniverse 的核心技术直接集成到现有的数字孪生设计与自动化软件应用中,或是集成到用于测试和验证机器人或自动驾驶汽车等自主机器的仿真工作流中。
了展示其作原理黄仁勋分享一个机器人仓库的演示——使用多摄像头感知和追踪,看顾工人并协调机器人叉车,在整个机器人堆栈运行的情况下,这些叉车能够实现自动驾驶。
黄仁勋还宣布,NVIDIA 将把 Omniverse 引入 Apple Vision Pro 中,通过新的 Omniverse Cloud API,开发者可以将交互式工业数字孪生流式传输到 VR 头显中。
一些全球大工业软件制商正在采用 Omniverse Cloud API,包括 Ansys、Cadence、达索系统旗下 3DEXCITE 品牌、Hexagon、微软、罗克韦尔自动化、西门子和 Trimble 等。
机器人技术
黄仁勋表示:“所有会动的东西都可能成为机器人,汽车行业将是其中的一个重要部分,NVIDIA 的计算平台已经应用在乘用车、卡车、配送机器人和自动驾驶出租车中。”
黄仁勋宣布,世界上最大的自动驾驶汽车公司比亚迪已选择 NVIDIA 的下一代计算平台用于其自动驾驶汽车,在 DRIVE Thor 上构建其下一代电动汽车车队。
为了帮助机器人更好地感知所处环境,黄仁还发布了 Isaac Perceptor 软件发工具包该工具包具有先进的多摄像头视觉里程计、3D 重建和占用地图,以及深度感知功能。
为了使机械臂更具适应性,NVIDIA 宣布推出 Isaac Manipulator —— 一个先进的机械臂感知、路径规划和运动学控制库。
最后,黄仁勋宣布了 Project GR00T,这是一个为人形机器人设计的通用基础模型,旨在进一步推动 NVIDIA 在机器人技术和具身智能方面的突破性工作。
为了支持这一努力,黄仁勋推出了一款用于人形机器人的新型计算机 Jetson Thor,它基于 NVIDIA Thor 系统级芯片,并对 NVIDIA Isaac 机器人平台进行了重大升级。
演讲接近尾之时,黄仁勋示了来自迪尼研究院的一对 NVIDIA 驱动的小型机器人。
黄仁勋表示:“计算机图形学、物理学和AI 是 NVIDIA 的灵魂所在,生成式 AI 时代一切改变都有可能发生。”