尚融 GTC 2026上，黄仁勋讲了个1万亿美元的故事

开启新征程

文｜动点科技

作者｜李鹏辉

再过一年，AI能够带来怎样的震撼？在黄仁勋看来，它可以精确到一个数字之上。

今年度的英伟达春晚GTC 2026上，黄仁勋为外界展示了这家芯片巨头对于AI下半场的思考与规划。他在演讲中提到，到2027年，英伟达已经看到了至少1万亿美元的需求（基于25、26、27年三年的需求预判总和）。而他也进一步指出，“我也相信，未来的实际计算需求会远高于这个数字。”

但就在一年前的GTC上，这个判断还是“到2026年，看到了Blackwell与Vera Rubin的5000亿美元（25年+26年的需求总和）的高信心需求和采购订单”。仅一年时间，黄仁勋对市场需求的预判有了显著增长。这场近3小时演讲的核心，则正是他的底气所在。

万亿需求，从何而来

黄仁勋对1万亿美元AI计算需求的判断，建立在他对这一轮AI变化的理解，以及英伟达过去20年积累的底层能力之上。

在演讲中，他将过去两年AI的发展拆解为三个关键节点：ChatGPT开启了生成式AI时代，让AI从感知理解走向了内容生成；o3系列推理模型的爆发，让AI实现了反思、规划与问题拆解，让生成式AI有了事实grounding；而像Claude Code这样的产品，则让AI进一步从“回答问题”走向“执行任务、完成实际工作”。

在他看来，这三个节点直接改变了AI计算的核心需求。

黄仁勋在演讲中提到，推理阶段的计算需求大约增长了1万倍，而AI的使用量又增长了100倍，因此他相信，过去两年全球AI计算需求整体增长了100万倍。在他看来，AI的发展早已越过了以训练为核心的阶段，重心已经大步走向了推理应用。

相应的，企业对AI基础设施的核心诉求也在随之改变。在黄仁勋的说法里，数据中心已经越来越像一座“token工厂”。在固定电力约束下，企业真正要盯住的，是单位功耗下能产出多少token，以及每个token的成本还能压到多低。

这也是黄仁勋为什么会把需求看到1万亿美元的关键原因之一：当AI全面进入推理驱动的落地阶段，从大模型厂商、云服务商，到各个行业的实体企业，都需要大规模的AI算力基础设施，来支撑token生产的核心需求。而在黄仁勋的判断里，这个需求的爆发才刚刚开始。

另一个底层支撑，是走过20年周期的CUDA生态。演讲开篇，黄仁勋用了大量篇幅致敬CUDA发布20周年，在他的逻辑里，CUDA是英伟达能承接万亿级需求的核心护城河。20年间，CUDA架构已经在全球积累了数亿级的GPU安装基数，形成了“安装基数吸引开发者——开发者创造算法突破——催生新市场——进一步扩大安装基数”的正向飞轮。

体现到现实层面，黄仁勋指出，6年前发布的Ampere架构，如今在云端的租赁价格仍在上涨。这背后的核心原因正是CUDA生态的持续软件优化，让老架构的算力价值不断增值，大幅延长了基础设施的使用寿命。对客户而言，这意味着投入的算力资产能持续产生价值，而这也是企业愿意大规模采购英伟达基础设施的核心前提。

对于未来，英伟达这样定义

围绕推理时代不断增长的token需求，英伟达这次在GTC上拿出的重点，已经不只是单一芯片。

正如演讲所展示的那样，这一轮布局的核心，是Vera Rubin平台。按英伟达官方的说法，这是一套由七颗芯片、五大机架级系统组成的AI超级计算机，面向Agentic AI的全生命周期而设计，涵盖计算、存储、网络与安全等多个层面。英伟达给出的关键指标，是其最高可实现10倍的推理吞吐/每瓦提升，并把每token成本压到原来的十分之一。

Vera Rubin平台。图源：英伟达

但这套平台的核心价值，远不止算力本身。

围绕Agentic AI在推理阶段对CPU环境、存储访问、网络扩展和系统调度的要求，英伟达同时推出了Vera CPU Rack、基于BlueField-4的存储与数据处理层，以及以Spectrum-X和Quantum-X800为代表的互联方案。它想解决的问题很明确：随着模型变大、上下文变长、KV缓存和企业数据调用越来越频繁，AI工厂需要被重新设计，存储、网络和CPU都不能再只是GPU的附属配角。

此外，针对推理行业长期存在的“高吞吐与低延迟难以兼顾”的问题，英伟达也希望通过Vera Rubin和Groq 3 LPX Rack相结合的方式解决。

黄仁勋把推理拆成两个环节：prefill预填充与注意力计算，需要高并行、高算力的通用计算能力；而token解码生成，则更依赖低延迟与高并发能力。英伟达给出的思路，是把这两类负载交给不同特性的计算单元分别处理，再通过低延迟互联把它们接起来。作为结果，官方表示，Vera Rubin与Groq 3 LPX的组合可带来35倍的吞吐/每兆瓦提升。

图源：英伟达

最后，面向更广阔的企业级市场，英伟达也拿出了更完整的软件和模型层组合。围绕企业结构化与非结构化数据处理，英伟达继续推进QDF和QVS；围绕OpenClaw，推出了NemoClaw，把安全、隐私和企业级可用性补进这套智能体框架；同时，Vera Rubin平台也和更大范围的Nemotron、自动驾驶、机器人与生物医疗模型体系一起，构成了英伟达这次想交出的“从推理到底层应用”的完整答案。

芯片、平台、生态

在黄仁勋的逻辑里，1万亿美元的AI计算需求，不是靠英伟达一家就能承接的，而最终的市场规模，也远不止1万亿美元。

他在演讲中强调，英伟达的核心战略，在于“垂直整合，水平开放”。

所谓垂直整合，是英伟达打通了从芯片、系统架构、算法库、基础模型到场景落地的全链条；而水平开放，是英伟达将所有打磨好的技术能力，全部开放给全行业的合作伙伴，让不同领域的企业都能基于英伟达的平台，低成本落地AI业务，而非打造封闭的自有生态。也正是这套战略，让英伟达的生态覆盖了AI产业的全链条。

放到更具体的行业里看，这套逻辑也已经开始显现。演讲提到，本次GTC参会人数最多的行业是金融服务。这意味着，金融机构已经成为这一轮AI落地中最活跃的参与者之一，算法交易等场景也正在从传统机器学习继续走向大模型。

此外，医疗行业同样被黄仁勋放到了重点位置。按他的说法，AI Biology、药物研发、诊断支持等方向都已经开始进入这一轮变化。而在自动驾驶领域，也已经有比亚迪、现代、日产、吉利四大车企新加入英伟达的robotaxi就绪平台，叠加此前的奔驰、丰田、通用等合作伙伴，每年覆盖的新车规模达到1800万辆。在机器人领域，英伟达则推出了从仿真、训练到落地的全栈工具链——据悉，本次GTC现场有110款机器人搭载了英伟达的相关技术。

开发者、初创公司与英伟达生态的下一站

当然，不可忽视的是，整个英伟达生态的核心生命力，也来自开发者与AI初创公司。

黄仁勋在演讲中提到，过去一年全球AI创业领域的风险投资达到1500亿美元。对英伟达来说，这些初创公司也是这轮生态扩张里最活跃的一部分力量。

英伟达通过开源模型、开放算法库、提供算力支持，降低了初创公司的AI开发门槛，而这些初创公司的成长与场景创新，又会持续放大全球AI计算的整体需求，成为英伟达未来增长的长期动力。为此，英伟达还启动了Nemotron联盟，联合多家顶尖AI初创企业，共同研发下一代基础大模型，持续完善开发者生态。