
开启新征程
文|动点科技
作者|李鹏辉
再过一年,AI能够带来怎样的震撼?在黄仁勋看来,它可以精确到一个数字之上。
今年度的英伟达春晚GTC 2026上,黄仁勋为外界展示了这家芯片巨头对于AI下半场的思考与规划。他在演讲中提到,到2027年,英伟达已经看到了至少1万亿美元的需求(基于25、26、27年三年的需求预判总和)。而他也进一步指出,“我也相信,未来的实际计算需求会远高于这个数字。”

但就在一年前的GTC上,这个判断还是“到2026年,看到了Blackwell与Vera Rubin的5000亿美元(25年+26年的需求总和)的高信心需求和采购订单”。仅一年时间,黄仁勋对市场需求的预判有了显著增长。这场近3小时演讲的核心,则正是他的底气所在。
万亿需求,从何而来
黄仁勋对1万亿美元AI计算需求的判断,建立在他对这一轮AI变化的理解,以及英伟达过去20年积累的底层能力之上。
在演讲中,他将过去两年AI的发展拆解为三个关键节点:ChatGPT开启了生成式AI时代,让AI从感知理解走向了内容生成;o3系列推理模型的爆发,让AI实现了反思、规划与问题拆解,让生成式AI有了事实grounding;而像Claude Code这样的产品,则让AI进一步从“回答问题”走向“执行任务、完成实际工作”。
在他看来,这三个节点直接改变了AI计算的核心需求。
黄仁勋在演讲中提到,推理阶段的计算需求大约增长了1万倍,而AI的使用量又增长了100倍,因此他相信,过去两年全球AI计算需求整体增长了100万倍。在他看来,AI的发展早已越过了以训练为核心的阶段,重心已经大步走向了推理应用。
相应的,企业对AI基础设施的核心诉求也在随之改变。在黄仁勋的说法里,数据中心已经越来越像一座“token工厂”。在固定电力约束下,企业真正要盯住的,是单位功耗下能产出多少token,以及每个token的成本还能压到多低。
这也是黄仁勋为什么会把需求看到1万亿美元的关键原因之一:当AI全面进入推理驱动的落地阶段,从大模型厂商、云服务商,到各个行业的实体企业,都需要大规模的AI算力基础设施,来支撑token生产的核心需求。而在黄仁勋的判断里,这个需求的爆发才刚刚开始。
另一个底层支撑,是走过20年周期的CUDA生态。演讲开篇,黄仁勋用了大量篇幅致敬CUDA发布20周年,在他的逻辑里,CUDA是英伟达能承接万亿级需求的核心护城河。20年间,CUDA架构已经在全球积累了数亿级的GPU安装基数,形成了“安装基数吸引开发者——开发者创造算法突破——催生新市场——进一步扩大安装基数”的正向飞轮。

体现到现实层面,黄仁勋指出,6年前发布的Ampere架构,如今在云端的租赁价格仍在上涨。这背后的核心原因正是CUDA生态的持续软件优化,让老架构的算力价值不断增值,大幅延长了基础设施的使用寿命。对客户而言,这意味着投入的算力资产能持续产生价值,而这也是企业愿意大规模采购英伟达基础设施的核心前提。
对于未来,英伟达这样定义
围绕推理时代不断增长的token需求,英伟达这次在GTC上拿出的重点,已经不只是单一芯片。
正如演讲所展示的那样,这一轮布局的核心,是Vera Rubin平台。按英伟达官方的说法,这是一套由七颗芯片、五大机架级系统组成的AI超级计算机,面向Agentic AI的全生命周期而设计,涵盖计算、存储、网络与安全等多个层面。英伟达给出的关键指标,是其最高可实现10倍的推理吞吐/每瓦提升,并把每token成本压到原来的十分之一。

Vera Rubin平台。图源:英伟达
但这套平台的核心价值,远不止算力本身。
围绕Agentic AI在推理阶段对CPU环境、存储访问、网络扩展和系统调度的要求,英伟达同时推出了Vera CPU Rack、基于BlueField-4的存储与数据处理层,以及以Spectrum-X和Quantum-X800为代表的互联方案。它想解决的问题很明确:随着模型变大、上下文变长、KV缓存和企业数据调用越来越频繁,AI工厂需要被重新设计,存储、网络和CPU都不能再只是GPU的附属配角。
此外,针对推理行业长期存在的“高吞吐与低延迟难以兼顾”的问题,英伟达也希望通过Vera Rubin和Groq 3 LPX Rack相结合的方式解决。
黄仁勋把推理拆成两个环节:prefill预填充与注意力计算,需要高并行、高算力的通用计算能力;而token解码生成,则更依赖低延迟与高并发能力。英伟达给出的思路,是把这两类负载交给不同特性的计算单元分别处理,再通过低延迟互联把它们接起来。作为结果,官方表示,Vera Rubin与Groq 3 LPX的组合可带来35倍的吞吐/每兆瓦提升。

图源:英伟达
最后,面向更广阔的企业级市场,英伟达也拿出了更完整的软件和模型层组合。围绕企业结构化与非结构化数据处理,英伟达继续推进QDF和QVS;围绕OpenClaw,推出了NemoClaw,把安全、隐私和企业级可用性补进这套智能体框架;同时,Vera Rubin平台也和更大范围的Nemotron、自动驾驶、机器人与生物医疗模型体系一起,构成了英伟达这次想交出的“从推理到底层应用”的完整答案。
芯片、平台、生态
在黄仁勋的逻辑里,1万亿美元的AI计算需求,不是靠英伟达一家就能承接的,而最终的市场规模,也远不止1万亿美元。
他在演讲中强调,英伟达的核心战略,在于“垂直整合,水平开放”。
所谓垂直整合,是英伟达打通了从芯片、系统架构、算法库、基础模型到场景落地的全链条;而水平开放,是英伟达将所有打磨好的技术能力,全部开放给全行业的合作伙伴,让不同领域的企业都能基于英伟达的平台,低成本落地AI业务,而非打造封闭的自有生态。也正是这套战略,让英伟达的生态覆盖了AI产业的全链条。
放到更具体的行业里看,这套逻辑也已经开始显现。演讲提到,本次GTC参会人数最多的行业是金融服务。这意味着,金融机构已经成为这一轮AI落地中最活跃的参与者之一,算法交易等场景也正在从传统机器学习继续走向大模型。
此外,医疗行业同样被黄仁勋放到了重点位置。按他的说法,AI Biology、药物研发、诊断支持等方向都已经开始进入这一轮变化。而在自动驾驶领域,也已经有比亚迪、现代、日产、吉利四大车企新加入英伟达的robotaxi就绪平台,叠加此前的奔驰、丰田、通用等合作伙伴,每年覆盖的新车规模达到1800万辆。在机器人领域,英伟达则推出了从仿真、训练到落地的全栈工具链——据悉,本次GTC现场有110款机器人搭载了英伟达的相关技术。
开发者、初创公司与英伟达生态的下一站
当然,不可忽视的是,整个英伟达生态的核心生命力,也来自开发者与AI初创公司。
黄仁勋在演讲中提到,过去一年全球AI创业领域的风险投资达到1500亿美元。对英伟达来说,这些初创公司也是这轮生态扩张里最活跃的一部分力量。
英伟达通过开源模型、开放算法库、提供算力支持,降低了初创公司的AI开发门槛,而这些初创公司的成长与场景创新,又会持续放大全球AI计算的整体需求,成为英伟达未来增长的长期动力。为此,英伟达还启动了Nemotron联盟,联合多家顶尖AI初创企业,共同研发下一代基础大模型,持续完善开发者生态。

图源:英伟达
至此,不难发现正是这些遍布全行业的合作伙伴、开发者与初创公司,共同构成了英伟达万亿级需求的基本盘。明年的GTC上,我们或许会看到这位皮衣教主为我们带来更为惊叹的数字,但无论是5000亿美元还是1万亿美元甚至更高,对英伟达来说,每一年,都会是新阶段的开始。而它的脚步,从未止步于此。
京海配资提示:文章来自网络,不代表本站观点。