微软也烧不起 Token ，该 DeepSeek 上位了

来源：36kr 2 小时前

负责 Copilot 业务的微软高管查尔斯·拉曼纳最近向媒体表示，Copilot Cowork 没法再提供「无限用」的套餐了，理由听上去有点凡尔赛：太受欢迎了。

微软四月底披露 Microsoft 365 Copilot 付费席位突破 2000 万，单季度净增 500 万，光埃森哲一家就签了 74 万席位，超过 90% 的财富 500 强在用某种形式的 Copilot。⁠

作为套壳产品，Copliot 借着微软办公套件的生态优势，实现「捆绑销售」，成为了企业级部署赛道上，装机量第一的选手。

可代价是成本也高，有的用户一周能让 Cowork 跑几百个任务，效率高得惊人。于是微软决定，Copilot Cowork 将改成按用量计费，用得多付得多。

同时，它正在悄悄给这自己找一台更平价的「引擎」，一个自家托管、经过微调的开源模型，候选之一，便是 DeepSeek V4。

一个「太能干」的烦恼

最早的 Copilot，是像刻板印象中的那样，嵌在 Word、Excel、PowerPoint、Outlook、Teams 里，在当前 app 内完成任务：写文档、做表格、总结邮件、生成纪要。本质还是「一问一答 + 在本 app 里帮你动手」，谈不上真正的跨工具自动化。

Copilot Cowork 如今已经完成了 agent 化的转型，从聊天机器人转为能完成系列任务的 AI 助手。，而且范围不只是办公三件套，而是整个 M365 生态（Word / Excel / PPT / Outlook / Teams / SharePoint），还能通过连接器接到 Gmail、Google Drive、OneDrive 等外部源。并且靠 Work IQ + Microsoft Graph 实现全局上下文存储和调用，让 Cowork 能读到你工作里散落在各处的资料。

能干是真能干，烧钱也是真烧钱。agent 每多调一次模型、多读一段上下文、多用一个工具，账单就要多一行。

过去微软的 Copilot 主要靠 OpenAI 和 Anthropic 的顶级模型撑场子，这些模型聪明，但也贵。当 Cowork 要面向千千万万企业用户，还要日夜不停地干活，每一次调用都乘以一个庞大的使用量，成本就会滚成一个吓人的数字。

于是微软的算盘是，能不能在那些不那么烧脑的日常任务上，换一台便宜点的引擎。

今年四月，DeepSeek 一口气放出两个开源模型，V4-Pro 和 V4-Flash，都支持一百万 token 的超长上下文。Pro 版本有一万六千亿参数，是目前公开权重里最大的模型之一，性能被认为已经逼近 OpenAI 和 Anthropic 的顶级闭源模型，用的却是最宽松的 MIT 开源许可。

超强的性能及性价比，让 DeepSeek 成为了基座模型中的「斩杀线」：比它强的没它便宜，比它便宜的没它强。

DeepSeek 采用「混合专家」的架构，模型虽然总参数巨大，但每处理一个任务只唤醒其中一小部分参数运作，于是单次推理的开销被大幅压了下来。这正好戳中微软的痛点。Cowork 那种没日没夜调模型的活儿，最怕的就是单次调用太贵，而 DeepSeek 这类模型天生就是冲着「便宜地跑起来」设计的。

一个把性能做到接近前沿、把价格打到地板、还干脆开源放出来的模型，对一个正在为账单发愁的巨头来说，吸引力不言而喻。

DeepSeek：我们的征程是星辰大海

有意思的是，几乎就在微软透露要用 DeepSeek 的同一周，DeepSeek 自己也上了头条。

本月 16 日，这家此前多年坚持不要外部投资的公司，完成了有史以来第一轮外部融资，进账超过七十四亿美元，投后估值冲到五百亿美元以上，这是中国创业史上最大的单笔融资之一。

DeepSeek 本次提出特殊的融资结构，创始人梁文锋自己是最大的出资人，他没有趁机套现，反而在用真金白银给自己的公司加仓。整轮投资人不到十家，腾讯、宁德时代这些产业巨头在列，基金要求需为纯人民币基金。梁文锋还表示，公司会继续走开源路线、追求通用人工智能，而不是急着变现。

独特的融资结构显示出，不是梁文锋需要基金，而是基金们需要梁文锋。DeepSeek 刚拿到的那笔钱，某种程度上就是市场对这条路线投下的信任票。它不靠卖 token 赚大钱，所以敢把价格打到地板，敢把模型白送出去。而正是这份不靠卖 token 赚钱的底气，让它在这场成本战里，站到了一个让别人羡慕的位置。

「多模型」时代的生意逻辑

微软强调，即便引入 DeepSeek，版本会全程托管在自家的 Azure 云上，数据不出微软的体系，并做了合规和减少偏见的处理。引入 DeepSeek，是微软往篮子里又多放了一个鸡蛋，不把宝押在任何一家模型上，手里攥着一堆模型。早两年大家还在争论谁家模型最强，如今微软用行动给出了答案，模型是用来干活的，不是用来站队的。

模型对厂商来说，正在从信仰变成零件，这也改变了产品设计的思路。

GitHub Copilot 是目前商业表现最好的协作产品，470 万付费订阅、年增 75%、已经被 90% 的财富 100 强公司引入。

在 GitHub Copilot 里开发者有一个模型菜单，每个模型旁边明码标着要花多少额度，贵的更强、便宜的更省，自己掂量。它还专门设了一个叫 Auto 的档位，系统自动路由，替你挑一个够用又便宜的，价格打折，等于用钱包引导你别动不动就上最贵的。

搜索起家的 Perplexity 也走这条路，让用户在一堆模型里自选，还更进一步推出了一个让三个模型同时回答、再由一个模型综合的功能，赌的是多个模型互相校验能减少盲点，把多模型当成了提高答案质量的手段。

Notion 也是一个典型，作为「小白友好」类型的产品，它主打一个随时切换底层模型还不丢上下文，把心思全花在跟工作区数据的打通上，把模型的选择交给用户。同时它也是和 Anthropic 合作最为紧密的公司之一，在 Fable 上线的当天，就让这个顶级模型出现在了自家产品的列表里。

明牌是一种做法，还有一种是隐藏基础模型。Cursor 默认让系统自动路由，日常任务交给自家训练的便宜模型兜底，几乎不限量，只有你手动点名要最前沿的模型，才从额度里扣钱。用自家便宜模型扛住大部分调用，把贵的留给真正需要的时刻。

AI 刚火那两年，Sam Altman 说过一句很有名的话，未来智能会「便宜到不用计量」。那时候各家比的是谁更慷慨，免费额度给得越多越好，包月套餐恨不得标上「无限」两个字，仿佛智能这东西取之不尽，用之不竭。

然而事实是，算力是有成本的，电费是要交的，芯片是要买的，再财大气粗如微软，也必须学会精打细算，那个又免费又无限的 AI 蜜月期，正在结束。

一个「太能干」的烦恼

DeepSeek：我们的征程是星辰大海

「多模型」时代的生意逻辑

相关新闻