黄仁勋Nvidia GTC 2026演讲主题 3 小时,核心围绕AI算力基础设施、AI推理时代、下一代芯片路线图、AI Agent、机器人与“物理AI”等方向
2026 年 3 月 16 日,Nvidia 在美国圣何塞举办年度大会 Nvidia GTC 2026。CEO Jensen Huang(黄仁勋)进行了接近 3 小时的主题演讲,核心围绕AI算力基础设施、AI推理时代、下一代芯片路线图、AI Agent、机器人与“物理AI”等方向。
Nvidia在GTC2026大会上,CEO黄仁勋提出AI产业重心已从“训练时代”转向“推理时代”,预计推理算力需求将比训练高1000倍,战略重点是建立AI工厂大规模生产token。Nvidia展示了芯片路线图,包括当前Blackwell架构、2026年发布的VeraRubin架构及2028年的Feynman架构,强调异构推理架构以降低成本。同时推出企业级AI Agent平台NemoClaw,强调AI终极形态是物理AI,涵盖机器人与自动驾驶技术,网络革命将融合光互连与铜互连。黄仁勋最终勾勒AI成为新的工业基础设施的愿景。

一、AI 正从“训练时代”进入“推理时代”
黄仁勋在开场提出一个关键判断:AI产业的重心正在从“训练(Training)”转向“推理(Inference)”。
原因有三:
- AI应用爆发
- Copilot、Agent、搜索、代码、客服等
- 需要实时推理能力
- 推理算力需求将远超训练
- 每个用户请求都需要推理
- 推理规模可能比训练高 1000倍
- 企业级AI开始普及
因此 Nvidia 的战略重点是:
建立“AI 工厂”(AI Factory)来大规模生产 token。
黄仁勋预计:AI芯片市场规模将在 2027 年达到 1 万亿美元级别。
二、AI基础设施:AI Factory 成为新的数据中心形态
黄仁勋提出一个重要概念:AI Factory(AI工厂)。区别:
| 传统数据中心 | AI Factory |
|---|---|
| 运行软件 | 生产 token |
| CPU主导 | GPU/AI加速器 |
| 面向存储计算 | 面向 AI 推理 |
AI 工厂核心组件:
- GPU计算
- CPU协同
- 网络互联
- 存储
- AI软件栈
Nvidia目标:把整个 AI 数据中心做成一个“整机产品”。
三、芯片路线图:Blackwell → Rubin → Feynman
本次 GTC 最大看点之一是 AI 芯片路线图。
1 Blackwell(当前)
当前主力 AI 架构:
- Blackwell GPU
- Grace CPU
- GB200 超级芯片
主要用于:
- 大模型训练
- 大规模推理
2 Vera Rubin(2026)
下一代架构:Vera Rubin
发布时间:2026 下半年
特点:
- 3nm 制程
- HBM4 内存
- 推理性能大幅提升
预计:
- 训练性能提升 3.5 倍
- 推理效率提升 10 倍
Rubin 架构由两部分组成:
- Vera CPU
- Rubin GPU
系统级平台:Rubin NVL72
3 Feynman(2028)
下一代 AI 架构:Feynman
定位:AI Agent 时代的计算架构
预计特点:
- 更高带宽 HBM
- 光互连
- 针对 AI reasoning 优化
发布时间:2028 年
四、AI推理架构:Prefill + Decode
黄仁勋提出:AI 推理需要新的计算架构。推理分为两个阶段:
1 Prefill
处理:
- prompt
- 上下文
特点:
- 大规模矩阵计算
适合 GPU
2 Decode
逐 token 生成
特点:
- 小计算
- 高频调用
因此 Nvidia 提出:异构推理架构
- GPU 负责 Prefill
- 专用芯片负责 Decode
目标:把 AI 推理成本降低一个数量级。
五、AI Agent 平台:NemoClaw
本次 GTC 还推出新的 Agent 平台:NemoClaw
定位:企业级 AI Agent 基础设施
功能包括:
- agent runtime
- agent orchestration
- agent memory
- tool integration
目标:让企业部署自主 AI agent。
六、网络革命:光互连 + 铜互连
随着 AI 工厂规模扩大:网络成为最大瓶颈。
黄仁勋强调:未来 AI 数据中心必须同时使用:
- 铜互连
- 光互连
特别是:Co-packaged optics(CPO)
原因:
AI工厂规模可能达到:GW级算力中心,网络需求指数级增长。
七、物理AI(Physical AI)
黄仁勋在演讲中反复强调:
AI 的终极形态是 Physical AI
也就是说:AI 不只是软件。
还要理解:
- 重力
- 摩擦
- 空间
- 物理世界
应用场景:
- 机器人
- 自动驾驶
- 工业自动化
八、机器人平台
Nvidia展示了多项机器人技术:
核心技术:
- Omniverse
- 仿真训练
- 机器人基础模型
流程:仿真训练 → 现实部署
目标:加速机器人开发。
九、自动驾驶
自动驾驶继续是 Nvidia 的重点。
平台:
- Drive AI
- 自动驾驶仿真
合作厂商包括:
- 多家车企
- 自动驾驶公司
十、黄仁勋的终极愿景
演讲最后,黄仁勋给出一个宏大叙事——未来计算三大阶段:
1️⃣ Accelerated Computing GPU改变计算
2️⃣ Generative AI 大模型时代
3️⃣ Physical AI AI进入现实世界
终极目标:让 AI 成为新的工业基础设施。

