暴涨31.8%背后，智谱卖API这事跑通了？

来源：36kr 2 小时前

昨天，智谱公布了2025 年全年业绩，这也是其上市后的首份财报。

全年实现收入7.24 亿元，同比增长 131.9%；但在 31.8 亿元研发投入的拉动下，经调整净亏损达到 31.82 亿元。

虽然亏了这么多，市场的反馈却非常积极。今天，智谱的股价上涨了31.8%。

其中，一个很重要的原因是，卖API这事看上去好像跑通了。

2025年，卖API的收入从2024年的0.48亿元增长至1.9亿元，同比增长296%。同时，智谱管理层在电话会议中明确提到，当前API服务ARR约为2.5亿美元，预计年底可以达到10亿美元。

更重要的是，这并不是孤例。在其他大模型公司身上，我们也逐渐看到类似的趋势：Token 调用量在上升，API 正在成为最直接的变现路径之一。

那么，我们应该怎么看待这个现象？今天我们就来结合智谱的财报说说。

基模增长，靠卖API

在智谱这份财报中，最值得关注的变化，是收入结构的迁移。

云端部署，已经成为最核心的增长来源。所谓云端部署，本质上就是API服务。2025年，这部分收入从2024年的0.48亿元增长至1.9亿元，同比增长296%；收入占比也从15.5%提升至26.3%。

API的增长，核心逻辑是调用量的增长。

而这背后离不开OpenClaw的推动。当Agent开始自动执行任务，一次需求往往对应多轮调用，Token消耗被成倍放大，API调用量随之上升。

这背后逐渐形成一个行业共识：当大模型具备长程任务执行能力后，调用不再停留在单次输入输出，而是演化为可持续运行的系统化过程。

在这种结构下，Token本身，成为最直接、也是最确定的计费单位。

换句话说，当模型能力足够强时，API本身就会收敛为大模型最清晰的商业模式。

这一趋势，正在成为大模型厂商的共同选择。

海外已经走得更早。Anthropic 约80%的收入，来自企业级API调用服务，本质就是围绕Token消耗的收费体系。

国内也在迅速靠拢这一结构。

目前，国内主流基座模型公司，如智谱AI、MiniMax、月之暗面的核心收入，正在逐步向API调用收敛，MaaS（Model as a Service）成为承接增长的主要路径。

智谱管理层在电话会议中明确提到，当前API服务ARR约为2.5亿美元，预计年底可以达到10亿美元。未来，公司也将更加侧重标准化API服务。到2026年，API服务与本地化部署预计各占一半；再往后2-3年，重心将进一步向API倾斜。

类似的变化，也正在MiniMax身上发生。

2025年，其开放平台与企业服务收入达到2596.3万美元，同比增长197.8%，收入占比从28.6%提升至32.8%。

截至2026年2月，公司ARR已突破1.5亿美元，相比2025财年的7900万美元实现翻倍增长。增长的核心驱动力，同样来自Token消耗的提升，尤其是编码助手与智能体（Agent）场景的放量。

高盛预计，2026年MiniMax来自开放平台（API）收入占比将达到约40%。

大模型商业模式的收拢，意味着价值的衡量方式也随之变得清晰：从“能力指标”，转向“Token计量”。

路线分化背后，两种解题思路

随着AI进入应用阶段，一个问题开始变得具体：当模型能力逐渐收敛，大模型的核心竞争力到底是什么？

关于这个问题，智谱和MiniMax 给出了两种不同的解法。

智谱的逻辑是，追求极致的模型上限。

张鹏提出了TAC（Token Architecture Capability，Token 架构能力）这一概念，本质可以拆解为三点：调用规模、调用质量，以及转化为收入的能力。

其核心判断是：智能的质量，决定定价权。

智谱的判断是：“随着Agent的演进，Token也会分层，低复杂度、标准化的token走向低价甚至免费，只有高复杂度、高可靠性的高质量token具备持续定价权。”

这一点已经在数据上有所体现。一季度，智谱API定价提升83%，但需求并未收缩，反而呈现供不应求，调用量增长达400%。

如果说智谱AI在讲的是“质量决定定价权”，那MiniMax讲的，其实是另一套逻辑：模型的竞争力，来自“路径差异化”和“效率”。

MiniMax选择了一条并不主流的路线——文本、视频、语音、音乐四大模态并行推进的全模态自研。这一点，在当前大模型厂商中并不常见。

这条路线的核心，不在于“多”，而在于“广”。

在闫俊杰看来，AI时代平台公司的价值，本质上是：智能密度 × Token吞吐量。

多模态的意义，是在不显著降低智能密度的前提下，放大Token吞吐量。因为它改变的不是能力上限，而是使用门槛。

当产品里加入图片、语音等交互方式时，用户的理解成本和操作门槛会明显下降，用户群体也随之扩展到更广的人群，包括老人、小孩等原本难以覆盖的群体。

这件事，其实在移动互联网已经发生过一次——从图文的信息流，到短视频的爆发，本质上都是通过降低交互门槛，换来渗透率的跃迁。

再看效率。MiniMax的另一条主线，是极致的资源利用效率。

2025年，公司研发投入2.53亿美元，同比增长33.8%，明显低于158.9%的营收增速。

对比之下，智谱AI的策略，更接近“高举高打”。

2025年，智谱收入7.24亿元，对应研发费用31.8亿元，研发费用率高达439%；同期MiniMax收入5.4亿元，研发费用17.43亿元，研发费用率为323%。

在经营效率上，智谱每获得1元收入，对应约4.4元亏损；MiniMax则为3.2元。在人效上，智谱约66万元，而MiniMax达到126万元。

当然，这里面有一部分差异来自商业模式，MiniMax更多依赖产品收入，而智谱仍以本地化部署为主。

但即便如此，两条路径的分化依然清晰：

一边是在追求“智能上限”，通过提升能力获取定价权；

另一边是在优化“效率与覆盖”，通过扩大使用规模，放大Token吞吐量。

本质上，这是同一个公式下，两种完全不同的解法。

寡头格局，才是基模生意的最大确定性

抛开估值不谈，模型厂商这门生意，其实已经开始显现出一个相对清晰的轮廓。

基模这门生意，不像传统软件。

传统软件是前期高投入、后期慢慢回收，但基模不一样，它的成本是台阶式上升的，收入却未必同步变厚，反而可能在竞争加剧中被不断压缩。

从这个角度看，它更像一种“先天偏脆弱”的结构。但有意思的是，这种结构反而指向了另一种结果：

它天然会走向寡头。

因为只有极少数公司，能够持续承受这种级别的投入。商业形态上，它更像电池或者晶圆厂，前期投入巨大，但一旦卡位成功，竞争者极少，蛋糕又足够大。

同时，大模型还有一个更微妙的地方：它并不完全是一个“赢家通吃”的市场，更接近是一个分层市场。

最顶层的模型，哪怕只有5%的效果优势，在coding等效率导向的复杂场景下会被放大成50%以上的溢价，这是乘数效应决定的。

但同时，并不是所有任务都需要最强模型。

于是市场会自然分层：顶层吃溢价，中层跑规模，底层承接长尾需求。甚至不同层级之间，还会形成某种“Token流动”——复杂任务向上，简单任务向下。

即使你做不到全局SOTA，那在某个细分领域做到SOTA，也是一条成立的路径。

而在这个结构里，效率也是一个非常关键的变量。

因为这个行业几乎没有网络效应，用户切换成本极低。这就意味着，只要有公司能做出一个“90分”的模型，同时价格更低，就可以迅速放量。

在这个过程中，效率也会成为商业化过程中重要变量。

由于没网络效应，用户切换成本低，只要有公司能做出一个“90分”的模型，同时价格更低，也能迅速放量。

原因也很直接，在部分场景里，并不需要最强模型。当效果差距有限时，价格就成为决定性因素。

而价格的背后，本质是成本。这不仅取决于技术，还有算力和电力等一系列成本的差异。

以中国为例，通过工程优化、规模化部署以及更低的电力成本，可以显著压低推理成本。这使得同等能力的模型，可以以更低价格对外提供Token服务。

现在一部分中国模型厂商的出海，本质上做的是一门“Token差价”的生意。

固然，收入增长性来源于爆发性的需求以及寡头的市场格局，不过这事也不能过于乐观，毕竟由于竞争环境的差异，中美在卖API这事上仍然有着很多不同：

比如，美国的大模型生态更依赖开发者长尾需求，企业客户和开发者更愿意为能力付费，模型性能更容易直接转化为溢价。

而国内调用更集中在头部客户，包括互联网平台和政企客户，加上供给端的竞争，Token的溢价大概率不会长期存在。

某种程度上说，在美国，基模更接近软件与平台的结合体，而在中国则更像基础设施的一部分。

从这个角度上说，国内大模型公司商业模型到底能跑到什么程度，或许还得再看看。

基模增长，靠卖API

路线分化背后，两种解题思路

寡头格局，才是基模生意的最大确定性

相关新闻