Token调用量大爆发，AI云成了一门好生意

来源：36kr 2 小时前

刚过去的三月份，AI行业最热的词属于Token（词元）。几件事情几乎同时发生：

国内，国家数据局局长刘烈宏在中国发展高层论坛宣布：中国日均Token调用量已突破140万亿，较两年前的1000亿暴增千倍。

海外，英伟达创始人黄仁勋在GTC大会上说：Token将是未来数字世界最核心、最值钱的大宗商品，Token的吞吐量将成为全球企业CEO追踪的核心经营数据。

同样在三月，阿里云在财报电话会上公布了一个非常激进的目标：五年内云与AI商业化年收入突破1000亿美元，隐含年复合增长率约47%。此外，字节跳动云计算业务火山引擎的豆包大模型日均调用量超过100万亿Tokens，跻身全球前三。

云计算作为AI时代的底层基础设置，重要性越来越高，而AI云正成为一门真正的好生意。

什么是好生意？在科技行业，标准基本可以概括为三条指标：规模效应带来的边际成本递减、客户生态锁定带来的高转换成本，以及建立在标准化产品之上的高毛利率与经常性收入。

这三条，亚马逊AWS、微软Azure、谷歌Cloud几乎同时满足。它们通过提供标准化的IaaS、PaaS、SaaS，构建了高壁垒、高利润的商业闭环：资源池越大成本越低，客户一旦迁入就难以离开，软件订阅则持续产生高毛利现金流。2025自然年，这三家云厂商的利润分别高达456亿、540亿和139.1 亿美元。

但中国云计算却走上了一条截然不同的路。过去十几年，尽管市场大盘不断扩大，但国内云厂商长期陷入了重资产、低毛利、高度内卷的集成商困境，利润却始终做不上去。背后原因在于特殊的IT消费习惯、贫弱的SaaS生态，以及大型政企客户对高度定制化的偏好。传统IaaS阶段，由于各家云厂商提供的计算、存储和网络资源高度同质化，市场竞争最终往往沦为价格战。为了争夺非互联网行业的政企大客户，云厂商做了大量低毛利、高人力的定制化开发与本地部署工作，这使得云计算从一种本应具备高度规模效应的轻量化服务，变为了以人力和硬件堆砌为主的传统IT项目制生意。

直到这一轮AI浪潮，为国内云计算厂商带来了重构商业模式的机会：将大模型封装成可调用、可计费的标准化云服务，卖给企业与开发者，成为新的增长引擎。

从价格战到涨价潮

AI首先推动了云计算行业的结构性增长。2025年第一季度，中国云基础设施服务支出达116亿美元，同比增长16%，AI相关需求已成为推动企业向云端迁移的主要动力。另据Omdia报告，2025年中国AI云市场规模预计达518亿元，同比增长148%，到2030年将突破1930亿元。（注：各家云厂商对AI云的定义有所不同）

但增长背后曾是惨烈的价格战。2024年5月，火山引擎旗下豆包大模型在国内率先掀起大模型的降级潮，此后，阿里云、百度智能云等相继跟进，大模型Token定价在不到一年内狂降超90%，部分云厂商的推理算力毛利率跌为负数。他们策略是“以亏损换规模”，毕竟谁能先在开发者和企业客户中建立起API调用习惯，谁就能在未来占据主动。

直到2026年初，价格战信号才开始逆转。海外，亚马逊AWS与谷歌Cloud先后宣布涨价，国内，阿里云、百度智能云、腾讯云随即跟进。3月18日阿里云和百度智能云同步官宣涨价，其中：

阿里云最高涨34%：对AI算力、存储等产品进行调价。其中，采用自研芯片的平头哥真武810E等算力卡产品上涨5%-34%；满足高性能计算的文件存储产品CPFS上涨30%。新价格于2026年4月18日起执行。

百度智能云最高涨30%：AI算力相关产品服务上调约5%-30%；并行文件存储等上调约30%。同样于2026年4月18日起生效。

涨价最直接的导火索就是激增的Token需求。单纯的大模型对话带来的Token消耗有限，而2026年Agent爆发和多模态模型成熟彻底扩容了AI云市场。尤其是Claude Code、OpenClaw等智能体产品的走红，让科技公司意识到，一次智能体任务往往包含多轮内部推理、工具调用和任务执行，其Token消耗量通常显著高于普通的AI对话。算力需求从“云端训练”彻底转变为“训练+推理”双轮驱动，导致现有AI算力资源极度紧缺。

正是这种算力供需关系的变化，直接催生了商业计费模式的改变。

从IaaS算力租赁到MaaS Token经济学

在传统的IaaS阶段，云厂商的核心商业模式是作为“二房东”，出租底层计算资源、存储空间和网络带宽，同质化严重。

Token出现打破了这一局面。Token是AI模型处理语言、图像、音视频的最小语义单元，用户每次与大模型交互，最终都被拆解成Token完成运算。以Token计费，云厂商从"卖硬件使用权"转变成了"卖智能服务"。

这套模式有优势非常明显：首先是抹平了硬件同质化。用户不再关心底层是什么GPU，只关心同等Token能否完成任务；其次是天然放大了规模效应。算力池越大，并发调度效率越高，分摊到每个Token的边际成本越低；最后是标准化API接口形成了生态锁定，调用习惯一旦建立，迁移成本极高。云服务真正变成了像水电一样，打开即用，接上即跑。

云厂商也正在将紧缺的AI算力资源向高附加值的Token业务倾斜。比如，腾讯云在过去一个多月快速整合资源，推出了覆盖云端、C端及企业版的“龙虾”产品矩阵，并直接将原有的MaaS大模型服务平台升级为TokenHub，推出统一的Token Plan服务。

智能体的普及使得原本按次调用的能力变成了高频、自动化的服务，极大地推高了云厂商的Token流水，也让MaaS业务有望在未来占到云厂商整体收入的30%甚至更高。

据《财经杂志》报道，2025年12月末，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中称，MaaS收入在云厂商整体收入的占比，有可能达到30%甚至更高。此外，亚马逊AWS管理层在2025年三季度财报电话会议上也曾披露，要把Bedrock打造成全球最大的推理平台，收入贡献将与其核心计算产品EC2不相上下，预计在总营收中占比超过30%。

而这正是顶级云生意所需要的"经常性、高毛利、可复制"的收入结构。

AI云的胜负手是全栈成本的竞争

模式虽好，但AI云的竞争正变得日趋激烈。

海外，转型AI云，成为亚马逊AWS、微软Azure、谷歌Cloud、甲骨文OCI的共同目标；国内，阿里云、百度智能云、腾讯云、火山引擎、华为云等科技云厂商，也纷纷强化自己的AI属性。各家云厂商的资本开支，也持续创新高。

在我们看来，AI云的竞争不是单纯的算力竞争，而是全栈成本的竞争。胜负手不在于谁的GPU更多，而在于谁能实现最低的"单位Token成本"。

美国四大云厂商的竞争已经验证了这个逻辑。谷歌是全栈整合程度最高的玩家，Gemini系列模型由自研TPU训练、部署在TPU上，芯片、模型、云服务三位一体，同时掌握成本控制权与定价权。亚马逊累计交付超140万枚自研Trainium 2芯片，性价比比同类英伟达GPU高30%-40%。反面教材案例甲骨文，无自研芯片，算力建设完全依赖英伟达，资本支出超过自身经营性现金流，同时高度依赖OpenAI单一客户，处境最为脆弱。

中国云厂商面临同样的竞争逻辑，叠加地缘压力，维度更为复杂。

阿里云拥有规模与全栈的双重优势，护城河最深。百炼MaaS平台聚合通义千问、DeepSeek等数十款主流模型；已累计向实际业务部署出货超过47万颗AI芯片，60%以上服务于外部商业化客户。未来三年，阿里宣布将投入超3800亿元用于云和AI基础设施建设。

百度智能云不急于抢Token流量规模，而是向能源、金融、汽车等垂直行业的核心流程深度渗透，凭借自研芯片昆仑芯、文心大模型与千帆平台的"芯-云-模-体"全栈自研体系，连续两年拿下国内大模型招投标项目数和中标金额双料第一。

火山引擎走的是激进的MaaS优先路线。字节跳动内部抖音、视频创作、Seedance视频生成模型等庞大的应用生态，平摊了基础设施固定成本，让火山引擎在Token价格上得以持续激进定价。据《晚点》报道，火山引擎此前曾定下了2026年MaaS业务收入超百亿元的目标，随着Seed 2.0、Seedance 2.0 等模型发布、OpenClaw持续爆火，团队已提升了收入目标。

腾讯云过去几年实现艰难转型。2022年前后，腾讯云主动砍掉低毛利总包业务，聚焦高毛利自研PaaS/SaaS产品，将"被集成"而非"总集成"树立为核心战略。短期市场份额承压，但改善收入结构：2025年IaaS占四成、PaaS占四成、SaaS占两成，而PaaS与SaaS的毛利率维持在50%-70%，远高于IaaS的10%-15%。成立12年后，首次实现规模化盈利，马化腾在财报中将其列为当年核心成就。

生成Token的成本与效率决定一切

AI将云计算的计费单元从同质化的算力资源转向差异化的智能服务；Token的爆炸式增长，使MaaS层收入很长一段时间内看不到天花板；标准化API带来的规模效应与生态锁定，正在赋予头部云厂商一定程度的定价权。

AI让云计算的生意模式变好了，但机会注定只属于少数玩家：有充裕的现金流，能承受千亿级算力军备投入；能自研芯片或深度国产算力整合能力，在英伟达生态之外构建成本控制能力；以及有自研模型和MaaS工程化落地能力，因为模型强弱直接决定单卡Token吞吐量，决定单Token成本，最终决定毛利率。

正如黄仁勋所说：生成Token的成本与效率，决定科技企业的营收与生死。

从价格战到涨价潮

从IaaS算力租赁到MaaS Token经济学

AI云的胜负手是全栈成本的竞争

生成Token的成本与效率决定一切

相关新闻