黄仁勋Nvidia GTC 2026演讲主题 3 小时,核心围绕AI算力基础设施、AI推理时代、下一代芯片路线图、AI Agent、机器人与“物理AI”等方向

2026 年 3 月 16 日,Nvidia 在美国圣何塞举办年度大会 Nvidia GTC 2026。CEO Jensen Huang(黄仁勋)进行了接近 3 小时的主题演讲,核心围绕AI算力基础设施、AI推理时代、下一代芯片路线图、AI Agent、机器人与“物理AI”等方向。

Nvidia在GTC2026大会上,CEO黄仁勋提出AI产业重心已从“训练时代”转向“推理时代”,预计推理算力需求将比训练高1000倍,战略重点是建立AI工厂大规模生产token。Nvidia展示了芯片路线图,包括当前Blackwell架构、2026年发布的VeraRubin架构及2028年的Feynman架构,强调异构推理架构以降低成本。同时推出企业级AI Agent平台NemoClaw,强调AI终极形态是物理AI,涵盖机器人与自动驾驶技术,网络革命将融合光互连与铜互连。黄仁勋最终勾勒AI成为新的工业基础设施的愿景。

 

一、AI 正从“训练时代”进入“推理时代”

黄仁勋在开场提出一个关键判断:AI产业的重心正在从“训练(Training)”转向“推理(Inference)”。

原因有三:

  1. AI应用爆发
    • Copilot、Agent、搜索、代码、客服等
    • 需要实时推理能力
  2. 推理算力需求将远超训练
    • 每个用户请求都需要推理
    • 推理规模可能比训练高 1000倍
  3. 企业级AI开始普及

因此 Nvidia 的战略重点是:

建立“AI 工厂”(AI Factory)来大规模生产 token。

黄仁勋预计:AI芯片市场规模将在 2027 年达到 1 万亿美元级别。

二、AI基础设施:AI Factory 成为新的数据中心形态

黄仁勋提出一个重要概念:AI Factory(AI工厂)。区别:

传统数据中心 AI Factory
运行软件 生产 token
CPU主导 GPU/AI加速器
面向存储计算 面向 AI 推理

AI 工厂核心组件:

  1. GPU计算
  2. CPU协同
  3. 网络互联
  4. 存储
  5. AI软件栈

Nvidia目标:把整个 AI 数据中心做成一个“整机产品”。


三、芯片路线图:Blackwell → Rubin → Feynman

本次 GTC 最大看点之一是 AI 芯片路线图。

1 Blackwell(当前)

当前主力 AI 架构:

  • Blackwell GPU
  • Grace CPU
  • GB200 超级芯片

主要用于:

  • 大模型训练
  • 大规模推理

2 Vera Rubin(2026)

下一代架构:Vera Rubin

发布时间:2026 下半年

特点:

  • 3nm 制程
  • HBM4 内存
  • 推理性能大幅提升

预计:

  • 训练性能提升 3.5 倍
  • 推理效率提升 10 倍

Rubin 架构由两部分组成:

  • Vera CPU
  • Rubin GPU

系统级平台:Rubin NVL72

3 Feynman(2028)

下一代 AI 架构:Feynman

定位:AI Agent 时代的计算架构

预计特点:

  • 更高带宽 HBM
  • 光互连
  • 针对 AI reasoning 优化

发布时间:2028 年


四、AI推理架构:Prefill + Decode

黄仁勋提出:AI 推理需要新的计算架构。推理分为两个阶段:

1 Prefill

处理:

  • prompt
  • 上下文

特点:

  • 大规模矩阵计算

适合 GPU


2 Decode

逐 token 生成

特点:

  • 小计算
  • 高频调用

因此 Nvidia 提出:异构推理架构

  • GPU 负责 Prefill
  • 专用芯片负责 Decode

目标:把 AI 推理成本降低一个数量级。


五、AI Agent 平台:NemoClaw

本次 GTC 还推出新的 Agent 平台:NemoClaw

定位:企业级 AI Agent 基础设施

功能包括:

  • agent runtime
  • agent orchestration
  • agent memory
  • tool integration

目标:让企业部署自主 AI agent。

六、网络革命:光互连 + 铜互连

随着 AI 工厂规模扩大:网络成为最大瓶颈。

黄仁勋强调:未来 AI 数据中心必须同时使用:

  1. 铜互连
  2. 光互连

特别是:Co-packaged optics(CPO)

原因:

AI工厂规模可能达到:GW级算力中心,网络需求指数级增长。


七、物理AI(Physical AI)

黄仁勋在演讲中反复强调:

AI 的终极形态是 Physical AI

也就是说:AI 不只是软件。

还要理解:

  • 重力
  • 摩擦
  • 空间
  • 物理世界

应用场景:

  1. 机器人
  2. 自动驾驶
  3. 工业自动化

八、机器人平台

Nvidia展示了多项机器人技术:

核心技术:

  • Omniverse
  • 仿真训练
  • 机器人基础模型

流程:仿真训练 → 现实部署

目标:加速机器人开发。


九、自动驾驶

自动驾驶继续是 Nvidia 的重点。

平台:

  • Drive AI
  • 自动驾驶仿真

合作厂商包括:

  • 多家车企
  • 自动驾驶公司

十、黄仁勋的终极愿景

演讲最后,黄仁勋给出一个宏大叙事——未来计算三大阶段:

1️⃣ Accelerated Computing GPU改变计算

2️⃣ Generative AI 大模型时代

3️⃣ Physical AI AI进入现实世界

终极目标:让 AI 成为新的工业基础设施。

分享至:
广而告之:欢迎注册币安BINANCE虚拟货币交易所!

刘春晓

春晓网创始人和主编。2011年毕业于河南大学新闻与传播学院,计算机和互联网爱好者。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注