暴涨31.8%背后,智谱卖API这事跑通了?
来源:36kr 2 小时前

昨天,智谱公布了2025 年全年业绩,这也是其上市后的首份财报。 

全年实现收入7.24 亿元,同比增长 131.9%;但在 31.8 亿元研发投入的拉动下,经调整净亏损达到 31.82 亿元。 

虽然亏了这么多,市场的反馈却非常积极。今天,智谱的股价上涨了31.8%。 

其中,一个很重要的原因是,卖API这事看上去好像跑通了。 

2025年,卖API的收入从2024年的0.48亿元增长至1.9亿元,同比增长296%。同时,智谱管理层在电话会议中明确提到,当前API服务ARR约为2.5亿美元,预计年底可以达到10亿美元。 

更重要的是,这并不是孤例。在其他大模型公司身上,我们也逐渐看到类似的趋势:Token 调用量在上升,API 正在成为最直接的变现路径之一。 

那么,我们应该怎么看待这个现象?今天我们就来结合智谱的财报说说。 

基模增长,靠卖API

在智谱这份财报中,最值得关注的变化,是收入结构的迁移。 

云端部署,已经成为最核心的增长来源。所谓云端部署,本质上就是API服务。2025年,这部分收入从2024年的0.48亿元增长至1.9亿元,同比增长296%;收入占比也从15.5%提升至26.3%。 

API的增长,核心逻辑是调用量的增长。 

而这背后离不开OpenClaw的推动。当Agent开始自动执行任务,一次需求往往对应多轮调用,Token消耗被成倍放大,API调用量随之上升。 

这背后逐渐形成一个行业共识:当大模型具备长程任务执行能力后,调用不再停留在单次输入输出,而是演化为可持续运行的系统化过程。 

在这种结构下,Token本身,成为最直接、也是最确定的计费单位。 

换句话说,当模型能力足够强时,API本身就会收敛为大模型最清晰的商业模式。 

这一趋势,正在成为大模型厂商的共同选择。 

海外已经走得更早。Anthropic 约80%的收入,来自企业级API调用服务,本质就是围绕Token消耗的收费体系。 

国内也在迅速靠拢这一结构。 

目前,国内主流基座模型公司,如智谱AI、MiniMax、月之暗面的核心收入,正在逐步向API调用收敛,MaaS(Model as a Service)成为承接增长的主要路径。 

智谱管理层在电话会议中明确提到,当前API服务ARR约为2.5亿美元,预计年底可以达到10亿美元。未来,公司也将更加侧重标准化API服务。到2026年,API服务与本地化部署预计各占一半;再往后2-3年,重心将进一步向API倾斜。 

类似的变化,也正在MiniMax身上发生。 

2025年,其开放平台与企业服务收入达到2596.3万美元,同比增长197.8%,收入占比从28.6%提升至32.8%。 

截至2026年2月,公司ARR已突破1.5亿美元,相比2025财年的7900万美元实现翻倍增长。增长的核心驱动力,同样来自Token消耗的提升,尤其是编码助手与智能体(Agent)场景的放量。 

高盛预计,2026年MiniMax来自开放平台(API)收入占比将达到约40%。 

大模型商业模式的收拢,意味着价值的衡量方式也随之变得清晰:从“能力指标”,转向“Token计量”。 

路线分化背后,两种解题思路

随着AI进入应用阶段,一个问题开始变得具体:当模型能力逐渐收敛,大模型的核心竞争力到底是什么? 

关于这个问题,智谱和MiniMax 给出了两种不同的解法。 

智谱的逻辑是,追求极致的模型上限。 

张鹏提出了TAC(Token Architecture Capability,Token 架构能力)这一概念,本质可以拆解为三点:调用规模、调用质量,以及转化为收入的能力。 

其核心判断是:智能的质量,决定定价权。 

智谱的判断是:“随着Agent的演进,Token也会分层,低复杂度、标准化的token走向低价甚至免费,只有高复杂度、高可靠性的高质量token具备持续定价权。” 

这一点已经在数据上有所体现。一季度,智谱API定价提升83%,但需求并未收缩,反而呈现供不应求,调用量增长达400%。 

如果说智谱AI在讲的是“质量决定定价权”,那MiniMax讲的,其实是另一套逻辑:模型的竞争力,来自“路径差异化”和“效率”。 

MiniMax选择了一条并不主流的路线——文本、视频、语音、音乐四大模态并行推进的全模态自研。这一点,在当前大模型厂商中并不常见。 

这条路线的核心,不在于“多”,而在于“广”。 

在闫俊杰看来,AI时代平台公司的价值,本质上是:智能密度 × Token吞吐量。 

多模态的意义,是在不显著降低智能密度的前提下,放大Token吞吐量。因为它改变的不是能力上限,而是使用门槛。 

当产品里加入图片、语音等交互方式时,用户的理解成本和操作门槛会明显下降,用户群体也随之扩展到更广的人群,包括老人、小孩等原本难以覆盖的群体。 

这件事,其实在移动互联网已经发生过一次——从图文的信息流,到短视频的爆发,本质上都是通过降低交互门槛,换来渗透率的跃迁。 

再看效率。MiniMax的另一条主线,是极致的资源利用效率。 

2025年,公司研发投入2.53亿美元,同比增长33.8%,明显低于158.9%的营收增速。 

对比之下,智谱AI的策略,更接近“高举高打”。 

2025年,智谱收入7.24亿元,对应研发费用31.8亿元,研发费用率高达439%;同期MiniMax收入5.4亿元,研发费用17.43亿元,研发费用率为323%。 

在经营效率上,智谱每获得1元收入,对应约4.4元亏损;MiniMax则为3.2元。在人效上,智谱约66万元,而MiniMax达到126万元。 

当然,这里面有一部分差异来自商业模式,MiniMax更多依赖产品收入,而智谱仍以本地化部署为主。 

但即便如此,两条路径的分化依然清晰: 

一边是在追求“智能上限”,通过提升能力获取定价权; 

另一边是在优化“效率与覆盖”,通过扩大使用规模,放大Token吞吐量。 

本质上,这是同一个公式下,两种完全不同的解法。 

寡头格局,才是基模生意的最大确定性

抛开估值不谈,模型厂商这门生意,其实已经开始显现出一个相对清晰的轮廓。 

基模这门生意,不像传统软件。 

传统软件是前期高投入、后期慢慢回收,但基模不一样,它的成本是台阶式上升的,收入却未必同步变厚,反而可能在竞争加剧中被不断压缩。 

从这个角度看,它更像一种“先天偏脆弱”的结构。但有意思的是,这种结构反而指向了另一种结果: 

它天然会走向寡头。 

因为只有极少数公司,能够持续承受这种级别的投入。商业形态上,它更像电池或者晶圆厂,前期投入巨大,但一旦卡位成功,竞争者极少,蛋糕又足够大。 

同时,大模型还有一个更微妙的地方:它并不完全是一个“赢家通吃”的市场,更接近是一个分层市场。 

最顶层的模型,哪怕只有5%的效果优势,在coding等效率导向的复杂场景下会被放大成50%以上的溢价,这是乘数效应决定的。 

但同时,并不是所有任务都需要最强模型。 

于是市场会自然分层:顶层吃溢价,中层跑规模,底层承接长尾需求。甚至不同层级之间,还会形成某种“Token流动”——复杂任务向上,简单任务向下。 

即使你做不到全局SOTA,那在某个细分领域做到SOTA,也是一条成立的路径。 

而在这个结构里,效率也是一个非常关键的变量。 

因为这个行业几乎没有网络效应,用户切换成本极低。这就意味着,只要有公司能做出一个“90分”的模型,同时价格更低,就可以迅速放量。 

在这个过程中,效率也会成为商业化过程中重要变量。 

由于没网络效应,用户切换成本低,只要有公司能做出一个“90分”的模型,同时价格更低,也能迅速放量。 

原因也很直接,在部分场景里,并不需要最强模型。当效果差距有限时,价格就成为决定性因素。 

而价格的背后,本质是成本。这不仅取决于技术,还有算力和电力等一系列成本的差异。 

以中国为例,通过工程优化、规模化部署以及更低的电力成本,可以显著压低推理成本。这使得同等能力的模型,可以以更低价格对外提供Token服务。 

现在一部分中国模型厂商的出海,本质上做的是一门“Token差价”的生意。 

固然,收入增长性来源于爆发性的需求以及寡头的市场格局,不过这事也不能过于乐观,毕竟由于竞争环境的差异,中美在卖API这事上仍然有着很多不同: 

比如,美国的大模型生态更依赖开发者长尾需求,企业客户和开发者更愿意为能力付费,模型性能更容易直接转化为溢价。 

而国内调用更集中在头部客户,包括互联网平台和政企客户,加上供给端的竞争,Token的溢价大概率不会长期存在。 

某种程度上说,在美国,基模更接近软件与平台的结合体,而在中国则更像基础设施的一部分。 

从这个角度上说,国内大模型公司商业模型到底能跑到什么程度,或许还得再看看。 

简体中文 English