刚过去的三月份,AI行业最热的词属于Token(词元)。几件事情几乎同时发生:
国内,国家数据局局长刘烈宏在中国发展高层论坛宣布:中国日均Token调用量已突破140万亿,较两年前的1000亿暴增千倍。
海外,英伟达创始人黄仁勋在GTC大会上说:Token将是未来数字世界最核心、最值钱的大宗商品,Token的吞吐量将成为全球企业CEO追踪的核心经营数据。
同样在三月,阿里云在财报电话会上公布了一个非常激进的目标:五年内云与AI商业化年收入突破1000亿美元,隐含年复合增长率约47%。此外,字节跳动云计算业务火山引擎的豆包大模型日均调用量超过100万亿Tokens,跻身全球前三。
云计算作为AI时代的底层基础设置,重要性越来越高,而AI云正成为一门真正的好生意。
什么是好生意?在科技行业,标准基本可以概括为三条指标:规模效应带来的边际成本递减、客户生态锁定带来的高转换成本,以及建立在标准化产品之上的高毛利率与经常性收入。
这三条,亚马逊AWS、微软Azure、谷歌Cloud几乎同时满足。它们通过提供标准化的IaaS、PaaS、SaaS,构建了高壁垒、高利润的商业闭环:资源池越大成本越低,客户一旦迁入就难以离开,软件订阅则持续产生高毛利现金流。2025自然年,这三家云厂商的利润分别高达456亿、540亿和139.1 亿美元。
但中国云计算却走上了一条截然不同的路。过去十几年,尽管市场大盘不断扩大,但国内云厂商长期陷入了重资产、低毛利、高度内卷的集成商困境,利润却始终做不上去。背后原因在于特殊的IT消费习惯、贫弱的SaaS生态,以及大型政企客户对高度定制化的偏好。传统IaaS阶段,由于各家云厂商提供的计算、存储和网络资源高度同质化,市场竞争最终往往沦为价格战。为了争夺非互联网行业的政企大客户,云厂商做了大量低毛利、高人力的定制化开发与本地部署工作,这使得云计算从一种本应具备高度规模效应的轻量化服务,变为了以人力和硬件堆砌为主的传统IT项目制生意。
直到这一轮AI浪潮,为国内云计算厂商带来了重构商业模式的机会:将大模型封装成可调用、可计费的标准化云服务,卖给企业与开发者,成为新的增长引擎。
从价格战到涨价潮
AI首先推动了云计算行业的结构性增长。2025年第一季度,中国云基础设施服务支出达116亿美元,同比增长16%,AI相关需求已成为推动企业向云端迁移的主要动力。另据Omdia报告,2025年中国AI云市场规模预计达518亿元,同比增长148%,到2030年将突破1930亿元。(注:各家云厂商对AI云的定义有所不同)
但增长背后曾是惨烈的价格战。2024年5月,火山引擎旗下豆包大模型在国内率先掀起大模型的降级潮,此后,阿里云、百度智能云等相继跟进,大模型Token定价在不到一年内狂降超90%,部分云厂商的推理算力毛利率跌为负数。他们策略是“以亏损换规模”,毕竟谁能先在开发者和企业客户中建立起API调用习惯,谁就能在未来占据主动。
直到2026年初,价格战信号才开始逆转。海外,亚马逊AWS与谷歌Cloud先后宣布涨价,国内,阿里云、百度智能云、腾讯云随即跟进。3月18日阿里云和百度智能云同步官宣涨价,其中:
阿里云最高涨34%:对AI算力、存储等产品进行调价。其中,采用自研芯片的平头哥真武810E等算力卡产品上涨5%-34%;满足高性能计算的文件存储产品CPFS上涨30%。新价格于2026年4月18日起执行。
百度智能云最高涨30%:AI算力相关产品服务上调约5%-30%;并行文件存储等上调约30%。同样于2026年4月18日起生效。
涨价最直接的导火索就是激增的Token需求。单纯的大模型对话带来的Token消耗有限,而2026年Agent爆发和多模态模型成熟彻底扩容了AI云市场。尤其是Claude Code、OpenClaw等智能体产品的走红,让科技公司意识到,一次智能体任务往往包含多轮内部推理、工具调用和任务执行,其Token消耗量通常显著高于普通的AI对话。算力需求从“云端训练”彻底转变为“训练+推理”双轮驱动,导致现有AI算力资源极度紧缺。
正是这种算力供需关系的变化,直接催生了商业计费模式的改变。
从IaaS算力租赁到MaaS Token经济学
在传统的IaaS阶段,云厂商的核心商业模式是作为“二房东”,出租底层计算资源、存储空间和网络带宽,同质化严重。
Token出现打破了这一局面。Token是AI模型处理语言、图像、音视频的最小语义单元,用户每次与大模型交互,最终都被拆解成Token完成运算。以Token计费,云厂商从"卖硬件使用权"转变成了"卖智能服务"。
这套模式有优势非常明显:首先是抹平了硬件同质化。用户不再关心底层是什么GPU,只关心同等Token能否完成任务;其次是天然放大了规模效应。算力池越大,并发调度效率越高,分摊到每个Token的边际成本越低;最后是标准化API接口形成了生态锁定,调用习惯一旦建立,迁移成本极高。云服务真正变成了像水电一样,打开即用,接上即跑。
云厂商也正在将紧缺的AI算力资源向高附加值的Token业务倾斜。比如,腾讯云在过去一个多月快速整合资源,推出了覆盖云端、C端及企业版的“龙虾”产品矩阵,并直接将原有的MaaS大模型服务平台升级为TokenHub,推出统一的Token Plan服务。
智能体的普及使得原本按次调用的能力变成了高频、自动化的服务,极大地推高了云厂商的Token流水,也让MaaS业务有望在未来占到云厂商整体收入的30%甚至更高。
据《财经杂志》报道,2025年12月末,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中称,MaaS收入在云厂商整体收入的占比,有可能达到30%甚至更高。此外,亚马逊AWS管理层在2025年三季度财报电话会议上也曾披露,要把Bedrock打造成全球最大的推理平台,收入贡献将与其核心计算产品EC2不相上下,预计在总营收中占比超过30%。
而这正是顶级云生意所需要的"经常性、高毛利、可复制"的收入结构。
AI云的胜负手是全栈成本的竞争
模式虽好,但AI云的竞争正变得日趋激烈。
海外,转型AI云,成为亚马逊AWS、微软Azure、谷歌Cloud、甲骨文OCI的共同目标;国内,阿里云、百度智能云、腾讯云、火山引擎、华为云等科技云厂商,也纷纷强化自己的AI属性。各家云厂商的资本开支,也持续创新高。
在我们看来,AI云的竞争不是单纯的算力竞争,而是全栈成本的竞争。胜负手不在于谁的GPU更多,而在于谁能实现最低的"单位Token成本"。
美国四大云厂商的竞争已经验证了这个逻辑。谷歌是全栈整合程度最高的玩家,Gemini系列模型由自研TPU训练、部署在TPU上,芯片、模型、云服务三位一体,同时掌握成本控制权与定价权。亚马逊累计交付超140万枚自研Trainium 2芯片,性价比比同类英伟达GPU高30%-40%。反面教材案例甲骨文,无自研芯片,算力建设完全依赖英伟达,资本支出超过自身经营性现金流,同时高度依赖OpenAI单一客户,处境最为脆弱。
中国云厂商面临同样的竞争逻辑,叠加地缘压力,维度更为复杂。
阿里云拥有规模与全栈的双重优势,护城河最深。百炼MaaS平台聚合通义千问、DeepSeek等数十款主流模型;已累计向实际业务部署出货超过47万颗AI芯片,60%以上服务于外部商业化客户。未来三年,阿里宣布将投入超3800亿元用于云和AI基础设施建设。
百度智能云不急于抢Token流量规模,而是向能源、金融、汽车等垂直行业的核心流程深度渗透,凭借自研芯片昆仑芯、文心大模型与千帆平台的"芯-云-模-体"全栈自研体系,连续两年拿下国内大模型招投标项目数和中标金额双料第一。
火山引擎走的是激进的MaaS优先路线。字节跳动内部抖音、视频创作、Seedance视频生成模型等庞大的应用生态,平摊了基础设施固定成本,让火山引擎在Token价格上得以持续激进定价。据《晚点》报道,火山引擎此前曾定下了2026年MaaS业务收入超百亿元的目标,随着Seed 2.0、Seedance 2.0 等模型发布、OpenClaw持续爆火,团队已提升了收入目标。
腾讯云过去几年实现艰难转型。2022年前后,腾讯云主动砍掉低毛利总包业务,聚焦高毛利自研PaaS/SaaS产品,将"被集成"而非"总集成"树立为核心战略。短期市场份额承压,但改善收入结构:2025年IaaS占四成、PaaS占四成、SaaS占两成,而PaaS与SaaS的毛利率维持在50%-70%,远高于IaaS的10%-15%。成立12年后,首次实现规模化盈利,马化腾在财报中将其列为当年核心成就。
生成Token的成本与效率决定一切
AI将云计算的计费单元从同质化的算力资源转向差异化的智能服务;Token的爆炸式增长,使MaaS层收入很长一段时间内看不到天花板;标准化API带来的规模效应与生态锁定,正在赋予头部云厂商一定程度的定价权。
AI让云计算的生意模式变好了,但机会注定只属于少数玩家:有充裕的现金流,能承受千亿级算力军备投入;能自研芯片或深度国产算力整合能力,在英伟达生态之外构建成本控制能力;以及有自研模型和MaaS工程化落地能力,因为模型强弱直接决定单卡Token吞吐量,决定单Token成本,最终决定毛利率。
正如黄仁勋所说:生成Token的成本与效率,决定科技企业的营收与生死。

