黄仁勋这次,讲的不是芯片,是 AI 的钱往哪流
来源:36kr 2 小时前

英伟达 CEO 黄仁勋在 2026 年 GTC 大会上的核心观点,强调 AI 产业正从模型训练转向推理应用的重大转折。文章指出,未来的数据中心将演变为生产 Token 的工厂,其商业逻辑由计算效率与产出价值直接驱动。随着推理需求爆发式增长,Token 已成为一种分层定价的商品,并深度嵌入企业预算与生产力工具中。这种转型催生了从云服务商到智能体服务 (GaaS) 的完整产业链,使 AI 真正成为能够执行复杂任务的“数字员工”。目前,金融、制造、汽车与机器人等行业正通过消耗大量 Token 实现降本增效,推动 AI 芯片市场向万亿美元规模跨越。全文揭示了 AI 算力如何转化为实际经济产出,标志着生成式 AI 商业化闭环的正式开启。

2026 年 3 月 16 日,美国圣何塞,GTC 2026 大会。

黄仁勋列举了这样一组变化:

  • 推理服务商过去一年增长了 100 倍;
  • 云服务商拿到了英伟达 60% 的收入;
  • SaaS 公司正在变成 GaaS 公司,从卖工具变成租赁智能体;
  • 企业开始给工程师配 Token 预算,相当于半个基础薪资;
  • 金融、制造、汽车、机器人,每个行业都在用 Token 降本增效。

他给出的判断是:到 2027 年,AI 芯片至少有 1 万亿美元的生意。但这 1 万亿不是卖芯片的钱,而是整条产业链的钱。

这条产业链的核心,是 Token。

未来的数据中心,是生产 Token 的工厂。这不是技术概念,这是一套完整的商业模型。

第一节|钱为什么开始流动

AI 产业正在经历一次关键转折。

过去两年,所有钱都往一个方向烧:训练更大的模型。但现在,钱开始往另一头走:让模型真正干活。

这个转折不是技术升级,而是三个节点连续引爆的结果。

第一个节点是 ChatGPT。

2022 年底上线后,AI 第一次从“能理解”变成了“能生成”。它不只是识别图片、翻译文字,而是可以写文章、写代码、生成从零开始的内容。

这打开了一扇门,但还不够。

第二个节点是 O1 和 O3 模型。

它们带来了推理能力。AI 开始能思考、能规划、能把一个复杂问题拆解成它能理解的步骤。黄仁勋在演讲里提到:推理让生成式 AI 变得值得信赖,并且植根于真相。

这让 AI 从“能做”变成了“能做对”。

第三个节点是 Claude Code。

这是第一个真正的智能体模型。它能读文件、写代码、编译、测试、评估,然后返回继续迭代。这是第一次,你不再问 AI“什么、哪里、怎么做”,而是直接让它:去创造、去执行、去开发。

AI 从工具变成了员工。

这三步走下来,计算需求爆炸了。

黄仁勋在演讲里给出了一组数据:

为了思考,AI 需要消耗的 Token 数量增加了 1 万倍。

使用量增加了 100 倍。

总计算需求:100 万倍。

看看市场就知道了。

OpenAI 和 Anthropic 现在就完全受限于算力。能拿到多少算力,就能生成多少 Token,收入就能涨多少。

这两年,AI 原生企业的融资规模也史无前例。投资总额达到 1500 亿美元,单笔融资从几百万、几千万,直接跳到数亿甚至数十亿美元。这些公司要么在创建 Token,要么在为现有的 Token 增加价值,而 Token 需要海量算力。

黄仁勋在去年说到 2026 年有 5000 亿美元市场时,现场没人觉得夸张。因为所有人都度过了创纪录的年份。

今年,他直接把数字提到了 1 万亿。

因为 AI 终于可以干活了。

第二节|Token 工厂经济学

“未来的数据中心,是生产 Token 的工厂。”

这句话背后,是一套完整的新商业模型。

过去的数据中心主要做两件事:存储数据,运行软件。建一个数据中心,核心考虑的是容量够不够大,能存多少东西。

现在不一样了。

AI 工厂的逻辑是:你能生产多少 Token,就能产生多少收入。

黄仁勋算了一笔账。一个 1 吉瓦的数据中心,电力是固定的。你不可能把它变成 2 吉瓦,这是物理限制。土地、电力、机壳,这些都是有上限的。那么在这个电力限制下,你的工厂能产出多少 Token,直接决定了你能赚多少钱。

这也是为什么他提出了一个关键指标:每瓦 Token 数。

听起来很技术,但换个说法就很好理解:同样的电费,你的工厂能产出多少货。

而 Token 现在已经开始分层定价。

免费层的 Token,可能不赚钱,但能吸引用户进来。

中等层的 Token,每百万个收费 3 到 6 美元。

高级层的 Token,更大的模型、更快的速度、更长的上下文,可以收到每百万个 45 美元。

最顶级的研究型服务模型,每百万个 Token 能收到 150 美元。

黄仁勋在演讲里举了个例子。一个研究团队,每天要用 5000 万个 Token,按每百万 150 美元算,一天就是 7500 美元。听起来很多,但对研究团队来说,这点钱根本不是问题。

因为 Token 带来的价值远超成本。

更有意思的是,Token 预算已经开始进入企业日常运营。

黄仁勋提到,硅谷现在招人,“这份工作附带多少 Token 额度”已经要写进 offer 里了。

他说,未来每个工程师都需要年度 Token 预算。基础薪水可能几十万美元,但公司还要额外给相当于半个基础薪水价值的 Token,让他们能获得 10 倍的生产力提升。

因为每个接触到 Token 的工程师,都会变得更有生产力。

这就是 AI 工厂的商业模型:

电力是成本上限,Token 是收入来源,架构决定了每瓦能产出多少货。

以 Blackwell 架构为例,相比上一代 Hopper,在相同电力下,收入可以提升 5 倍。如果换成最新的 Vera Rubin 架构,收入可以再提升 5 倍。

换句话说,两年时间,同一个 1 吉瓦的工厂,Token 产出从每秒 20 万个,提升到每秒 7 亿个。

提升了 350 倍。

这不是技术参数的变化,这是赚钱逻辑变了。

未来每一家云服务商、每一家 AI 公司、每一家企业,都会盯着同一个指标:我的 Token 工厂效率是多少。

这直接决定了你能赚多少钱。

第三节|谁在赚这笔钱

当 Token 变成商品,一条新的价值链就出现了。

钱的流向变得很清晰:企业买 Token → 推理服务商或 GaaS 公司 → 云服务商 → 英伟达。

而在这条链上,已经有人开始赚到钱了。

第一批是推理服务商

Fireworks、Together AI、Lin 这些公司,过去一年增长了 100 倍。

它们做的事情很简单:建 Token 工厂,然后把 Token 卖给企业。

黄仁勋在演讲里展示了一组数据。这些推理服务商刚接入英伟达的软件更新时,Token 生成速度大约每秒 700 个。

更新之后,直接涨到每秒 5000 个。

提升了 7 倍。

同样的硬件,同样的电力,产出直接翻了 7 倍。这对它们来说就是收入翻 7 倍。

这也是为什么黄仁勋说,这些 Token 工厂的效率和性能,对它们来说就是一切。

第二批是云服务商

黄仁勋透露了一个数据:英伟达 60% 的收入来自排名前五的 hyperscalers,也就是那几家最大的云服务商。

但这 60% 里面,还包括它们自己的内部消耗。比如推荐系统、搜索引擎,现在都在从传统算法转向深度学习和大语言模型。

更重要的是,英伟达和云服务商的合作模式很特别。

英伟达不只是卖硬件,它把整个软件库整合进去,把客户带到云上。所有那些 AI 原生企业、所有需要 Token 的公司,英伟达帮它们找到云服务商。

反过来,云服务商也在主动要求英伟达把下一个客户落地到它们的云上。

因为这 1 万亿的投资,这些正在建设的 Token 工厂,需要客户来消耗算力。

第三批是 SaaS 公司

黄仁勋在演讲里说了一句话:每一家 SaaS 公司,都将变成一家 GaaS 公司。

GaaS 是 Agentic as a Service,智能体即服务。

过去 SaaS 公司卖的是工具。你付费,我给你一套软件,你的员工用这套软件干活。

未来 GaaS 公司卖的是智能体。你付费,我给你一批 AI 助手,它们直接帮你干活。

这个转变的关键是 Open Claw。

Open Claw 是最近几周爆火的开源项目,黄仁勋说它是有史以来最受欢迎的开源项目,仅用几周时间就超越了 Linux 30 年的成就。

它的本质是智能体的操作系统。就像 Windows 让我们能够创造个人电脑,Open Claw 让我们能够创造个人智能体。

但企业级部署有个大问题:智能体会访问敏感信息、执行代码、向外通信。这三件事合在一起,意味着它可能把公司的财务数据、供应链信息发送出去。

所以英伟达和 Open Claw 合作,开发了 NeMo-Claw 企业级参考设计。加入了策略引擎、网络护栏、隐私路由器,让智能体可以安全地在企业内部运行。

黄仁勋说,每一家公司现在都需要一个 Open Claw 战略。

因为企业 IT 原本是 2 万亿美元的产业,现在它将变成数万亿美元的产业。不只是提供工具,还在租赁智能体。

第四批是企业本身

企业现在有两个角色:既是 Token 的买家,也开始成为 Token 的制造者。

作为买家,企业在给员工配 Token 预算,让工程师的生产力提升 10 倍。

作为制造者,一些企业开始建自己的 AI 工厂。不只是为了用 AI,还发现能直接降本增效。

现在这条价值链已经跑起来了。

推理服务商在扩产能,云服务商在建工厂,SaaS 公司在转型 GaaS,企业在采购 Token。

从生产 Token 到消费 Token,整个闭环都建立起来了。

第四节|钱流向了哪些行业

当 Token 工厂开始运转,最直接的问题就是:谁在用这些 Token?

黄仁勋在演讲里提到了一个细节。这次 GTC 大会,参加人数比例最大的行业是金融服务。

他说,我希望来的是开发者,不是交易员。

但交易员来了这么多,是有原因的。

金融行业正在经历它的深度学习时刻。

过去的算法交易,是量化分析师做大量人类特征工程,然后用经典机器学习跑模型。现在不一样了。AI 超级计算机可以自动研究海量数据、发现规律、找出交易信号。

这和当年深度学习改变计算机视觉一样,是一次范式转变。

而金融行业的特点是:速度就是钱。

每毫秒的延迟,都可能意味着数百万美元的差异。这也是为什么它们愿意为高速 Token 付费,愿意用最顶级的推理服务。

第二个已经看到效果的是制造业

黄仁勋展示了两个案例。

雀巢每天要做成千上万个供应链决策。它们的订单到现金数据集市,汇总了 185 个国家的每一次供应、订单和交付信息。

用传统 CPU,雀巢每天只能刷新几次数据。

换成英伟达 GPU 加速后,速度提升 5 倍,成本降低 83%。

另一个是 Snapchat。它们用英伟达加速 Google BigQuery,成本直接降了 80%。

这两个数字很直接:5 倍速度,降本 80% 以上。

对制造业和互联网公司来说,这不是概念,是立刻能看到的收益。

第三个是汽车

黄仁勋在演讲里宣布了四个新的 RoboTaxi Ready 合作伙伴:比亚迪、现代、日产、吉利。

这四家加起来,每年生产 1800 万辆汽车。

再加上之前已经合作的梅赛德斯、丰田、通用,支持 RoboTaxi 的汽车数量会非常庞大。

更重要的是,英伟达还和 Uber 达成了合作,将在多个城市部署并连接这些 RoboTaxi Ready 汽车到 Uber 网络。

黄仁勋说,自动驾驶的 ChatGPT 时刻已经到来。我们现在知道,可以成功地、自动地驾驶汽车了。

每一辆自动驾驶汽车,本质上就是一个移动的 Token 工厂。它要不断识别道路、判断距离、规划路线、处理突发情况,每一个动作背后都需要实时生成 Token。

第四个是机器人

这次 GTC 现场有 110 个机器人。黄仁勋说,几乎世界上每一家制造机器人的公司都在和英伟达合作。

机器人行业有个特点:真实世界的数据永远不够。

你不可能让机器人在真实环境里试错几万次来学习。那太慢了,也太危险。

“对机器人来说,算力就是数据。”

用算力做模拟,生成海量合成数据,让机器人在虚拟环境里学习,然后再部署到真实世界。

英伟达为此构建了完整的技术栈:Isaac Lab 用于训练,Newton 用于物理模拟,Cosmos 世界模型用于神经模拟,Groot 基础模型用于推理和动作生成。

现场还有个彩蛋。迪士尼的雪宝机器人走上台,和黄仁勋对话。

黄仁勋说,你能想象迪士尼乐园的未来吗?所有这些角色到处漫步。

雪宝是在英伟达 Omniverse 里学会走路的,用的就是 Newton 物理求解器。

这四个行业,金融、制造、汽车、机器人,有个共同点:它们都需要大量实时推理,都需要持续生成 Token。

黄仁勋在演讲里反复强调的,就是这些场景。

结语|流向变了

AI 产业的钱,流向变了。

不再只往训练模型那边烧,开始往推理、部署、应用那边走。

这个变化背后,是三个关键转折:

ChatGPT 让 AI 能生成内容。

O1 让 AI 能思考规划。

Claude Code 让 AI 能执行任务。

AI 终于可以干活了,计算需求暴涨 100 万倍。Token 变成商品,开始分层定价。数据中心变成工厂,效率决定收入。从生产 Token 到消费 Token,整条产业链都建立起来了。

钱不再只流向训练模型的人,而是流向把模型用起来的人。

参考资料:

https://www.youtube.com/watch?v=GnUeIX9Ay04&t=3157s

https://www.youtube.com/watch?v=jw_o0xr8MWU&t=5474s

来源:官方媒体/网络新闻

简体中文 English