Kimi的问题不在对手，而在起点

来源：36kr 1 小时前

杨植麟身上正在形成一种很典型的创业者光环。

行业抬头看技术，他站在台上讲推理、Agent和未来几年由AI主导的研发；市场低头看产品，Kimi在过去几个月里快速上线了一系列新功能：能写文档、做PPT、处理表格、写代码的KimiCode，能自动抓取网页信息的Kimi Claw，能深度检索资料的Deep Research，以及能多个AI协作完成复杂任务的Agent Swarm。

外界因此很容易得出一个顺滑结论：月之暗面（以下简称月暗）正在从一家明星模型公司，走向一家下一代生产力平台公司。

这个判断没有错，只是不够完整。

因为当Kimi不再满足于只做一个“会回答问题”的模型，而是试图成为“知识工作的执行平台”，它真正进入的，就不再是一个靠技术突破就能轻易赢下来的赛道。那里站着的不只是几家大模型公司，而是一整排已经控制了开发者入口、办公入口和企业工作流的巨头。

而Kimi的难，不只是对手强，更在于它几乎同时在做两件最重的事：一边补足承接复杂工作的底层能力，一边又去争知识工作的前台入口——

别人要么手里已经有入口，要么先从能力层往上爬，Kimi 则更像是在地基尚未完全筑厚时就把自己推到了正面战场。而这条路的资本强度太高，护城河形成速度又未必能快到和烧钱速度匹配。

杨植麟擅长把控方向，但一家公司的胜负，从来不只取决于方向，还取决于能不能把技术、产品、增长和商业化，用同一种节奏拧在一起。

前者更像天才的直觉，后者则属于企业家的功课。与其说杨植麟已经给出了完整答案，不如说，他正走到这道题最难的部分。

01 光环

2026年3月，美国拉斯维加斯英伟达GTC大会的主舞台上，杨植麟与OpenAI、DeepMind的负责人并列而坐。这是全球AI顶级从业者的标准合影，但杨植麟的身份标签与旁人略有不同——他是唯一独立大模型创业公司的代表，其余均为科技巨头旗下的项目负责人。

这张照片传回国内时，月之暗面的估值刚刚突破180亿美元，三个月内翻了两番，创下中国公司晋级“十角兽”（指那些估值超过100亿美元的未上市初创公司）的最快纪录之一。

不过，它的身份或许很快会再次发生变化：前不久，彭博社传出消息，月之暗面已与中金公司和高盛展开关于赴港IPO事宜的初步接触。智谱与MiniMax高光在前，对于月暗的IPO之路，外界很容易把这种光提前投射到这家公司身上。

这也几乎是杨植麟身上那层创业者光环的自然延伸。

在中国这一代AI创业者里，杨植麟是少数几个不能只放在国内语境里讨论的人。并且在决定大模型公司上限的那些关键问题上，月之暗面已经不能只拿来做本土比较。

真格基金作为月暗早期的投资机构之一，管理合伙人戴雨森对于杨植麟的认可是不加掩饰的，他曾在一篇文章中透露，杨植麟在清华读书时被公认为“神中之神”。这样的情绪渲染对于理解杨植麟并不完全多余。

杨植麟的学术底色，几乎是为大模型时代提前铺好的：

2015年，他从清华大学计算机系毕业，后以年级第一的成绩进入卡内基梅隆大学语言技术研究所。此后四年，他持续出现在ICML、NeurIPS、ICLR等AI顶级会议的作者名单里，很早就进入全球最核心的学术评价体系。

更重要的是，这并不只是“发过几篇好论文”那么简单。他以第一作者或共同第一作者身份参与提出的Transformer-XL 和XLNet，至今仍是预训练模型发展史上绕不开的名字。前者推动了长文本建模能力的跃迁，后者更是预训练模型领域绕不开的里程碑，其思想直接影响了后续GPT系列的技术路线。

2019年，他成为ACL（计算语言学协会，顶级国际学术组织）史上最年轻的领域主席之一，在创立月之暗面之前，又先后在Google Brain 和FAIR（Meta旗下基础人工智能研究研究院）任职——既有理论研究者的锋利，也有顶尖工业实验室训练出来的工程质感，这样的经历，在国内并不常见。

也正因如此，外界在评价月之暗面时，谈论的往往不只是能力，还有一种更难被量化的气质。或许用Manus首席科学家季逸超对Kimi的评价可以一语概之：

“Kimi这家公司，还是比较有品味的。”

品味，taste，这两年频繁的在创投圈里被提起，常常被认为是AI公司唯一的护城河。2026年3月《纽约客》甚至直接写：“taste”已经成了硅谷新的buzzword，热度有点像 2010年代的“disruption”。

在季逸超眼中，品味的具象化，体现在一家公司的evaluation或者内部的benchmark上，“因为你内部的衡量指标，无论是对于模型的benchmark，还是对于人，其实决定了这家公司和产品该走的方向”。

杨植麟身上一个很突出的特点是，他似乎并不满足于“按别人的题目把分考高”，而总想先确认：这道题本身出得对不对。

绝大部分行业公开的benchmark从根本上来说是由人工定义的，经常会存在benchmark不够或者失效的现象。

“现在agent能用的benchmark不是很多，而且你在benchmark上看到一个分数，很多时候并不是agent能力的反应，甚至很片面，这个是我觉得大家要去解决的一个问题。”杨植麟在《张小珺|商业访谈录》的播客中，曾披露过行业的这一现状。

但很多公司为了刷分，只针对性的让模型做几个特定场景，以方便对外发新闻稿来达到不同的目的，然而，那并不是模型真实的表现能力，在一些更OOD(Out-of-Distribution，可简单理解为“超纲“)的场景里，体感就会变得很差。

基于此，月暗内部补了一套更贴近真实工作的benchmark：

比如K2.5在代码方向上，并不只看公开榜单，而是自己设计了Kimi Code Bench，去衡量build、debug、refactor、test这些更接近真实软件工程的任务；在办公场景里，又专门做了AI Office Benchmark和General Agent Benchmark，去看Office输出质量和多步工作流到底完成得怎么样。

往里一层，在K2.5 Agent Swarm的训练里，它的奖励机制也不只是“调来更多agent”这种表面的热闹，它会刻意避免两种情况：看起来很多agent，实际还是串行在做；或者为了“并行”好看，硬拆出一堆无效步骤，反而拖慢整体进度。

这几乎是季逸超那句话的具象版本：你用什么 benchmark，就会训练出什么产品。月暗不是先做出一堆功能，再反过来替它们找解释，恰恰相反，是它先决定什么样的能力值得被度量，产品才沿着这些指标往外生长。

只是，这样的路径也意味着更高的研发成本，更慢的产品节奏，以及对底层模型能力持续兑现的更高要求。

事实上，这也是杨植麟过往风格的延续。

无论是Transformer-XL，还是后来的XLNet，他做的都不只是沿着既有路径再往前推一点。前者试图解决的是，模型在面对更长信息时，为什么总会出现记不住、接不上的问题；后者则干脆绕开当时主流预训练路线的一些先天缺陷，重新改写了题目本身。

这两项工作的共同点在于，它们都没有停留在既定框架里做加法，而是直接碰了当时行业默认接受的前提。

这就是杨植麟。他似乎从来不满足于只在现成赛道上提速，而总要先追问一句：这条赛道的起点、规则和边界，是否本来就值得重画。

到了创业时期，他身上这种“先定义问题，再做技术”的习惯，变得更具体了。

早在2023年Kimi以超长文本能力进入公众视野时，杨植麟看重的就不只是“能装下更多内容”，而是另一件更底层的事：当信息越来越多、任务越来越长时，模型还能不能把前后文接住，并持续往前推。

今天再回头看，Kimi首页摆出来的，已经不只是一个对话框，而是Docs、Slides、Sheets、Deep Research、Kimi Code、Kimi Claw、Agent Swarm这样一整排能力模块。表面上看，这是产品在变多；往深一层看，它们其实都在回答同一个问题：

模型真正的价值，不是某一刻把一句话答得多漂亮，而是任务一旦被拉长、被做复杂之后，它还能不能一路不掉链子地把整件事接住。

而一个试图做到这一点的产品，最终就很难停留在“聊天助手”的位置上，它会被一步步推向更重的角色：知识工作的入口、调度台，甚至执行平台。

但当Kimi从“回答问题”转向“调度知识工作”，它就很难只守一头：往下要补模型，往上要争入口。缺了用户关系，只是别人的能力供应商；缺了底层能力，又撑不起“把事做完”的承诺。这意味着月之暗面从一开始就走进了一场更重的战役——资本密度更高，兑现周期更长。

而当一家公司同时打两场战争，钱就不再只是财务问题，而是战略本身。月之暗面当然不至于为生存发愁，但它怎么会不缺钱呢？

02 怎么会不缺钱呢？

2025年的最后一天，杨植麟发布内部信，透露公司的现金持有量超过100亿元，作为对比，同样以IPO前的财务数据为基准：MiniMax在赴港招股时，若只看现金及现金等价物，约为24.9亿元人民币；智谱同期约为25.5亿元人民币。若按更宽口径看可动用资金，MiniMax约为72.1亿元人民币，智谱约为32.1亿元。

于是，杨植麟说：“我们短期不着急上市”。然而3个月后，月暗IPO的消息不胫而走。看起来，似乎与杨植麟的“不着急”前后矛盾。

不过，把这两句话放回同一条时间线上看，它们未必真的互相抵触：前者说的是，月之暗面当下并不需要为生存或续命仓促上市，后者对应的则是，在AI概念再度受到资本追捧的窗口期，这家公司也没有理由把一条可能更宽的融资通道长期关在门外。

要知道，能不为眼前的生存焦虑上市，和该为下一场更昂贵的战争提前备粮，本来就是两回事。

更何况，月之暗面怎么会不缺钱呢？

行业如今正在发生的变化是：模型公司向上抢入口，办公巨头向下吞模型，协作平台横向加AI。这三股力量表面上方向不同，但底层想争的是同一样东西：知识工作的控制点——也就是杨植麟目前所在的战场。

说的更直接一些，大家都想从“帮用户做一点事”走向“定义用户怎么做事”。

原因并不复杂：大模型正在变得越来越聪明，但“聪明”本身并不直接创造价值。真正决定价值能否落地的，是谁能先把这颗大脑接进现实世界的手和脚里。

就像一个伟大的方案，若不能执行落地，那无异于纸上谈兵。

一个大模型公司都不得不面对的事实是：模型层的“纯智力租金”正在快速被压缩。

我们以Anthropic为例：Anthropic在2024年6月发布Claude 3.5 Sonnet时，API定价就是$3/百万输入token、$15/百万输出token；到2026年的Claude Sonnet 4.6，官方文档给出的价格仍然是$3/$15，但上下文窗口已经到了1M token，并明确主打agents、coding、computeruse。

也就是说：模型能力在显著跃迁的同时，单位“智力”的价格并没有跟着抬升，反而更像被竞争锁死了。

国内就更不必说，2025年，大模型价格战已经卷到几乎贴着成本线打：阿里云2月将通义千问视觉理解模型降价超80%，百度4月发布文心4.5 Turbo和X1 Turbo时，又把输入价分别打到0.8元和1元/百万tokens，月暗也在同月下调开放平台价格，官方明确写到，Kimi-latest自动缓存后的价格仍只有1元/百万tokens。

《财经》曾援引多位云厂商负责人的说法指出，2024年5月以前，国内大模型推理算力毛利率还高于60%；但在5月各大厂接连降价后，这一毛利率已跌至负数。

另一边，头部公司的路径已经越来越一致：卖的都不只是 token，而是把模型变成能真正干活的系统。

OpenAI已经把web search、file search、containers 单独拿出来收费，在Responses API 和Agents SDK 里，也直接把工具调用、状态管理、多步执行写进产品定义；Anthropic同样不再只收模型调用费，web search 和 code execution另行计价，对Claude Code的定义也不再是代码补全，而是能读代码库、跨文件修改、运行测试、交付结果；

Google一边在Gemini API里把搜索增强、上下文缓存存储拆出来卖，一边又把Gemini全面塞进 Gmail、Docs、Sheets、Meet、NotebookLM 等Workspace体系，强调服务每个员工、每条工作流；

微软则把Copilot做成贯穿Microsoft 365的工作入口，覆盖聊天、搜索、文件、邮件和agents构建；飞书和钉钉也都在把AI往会议纪要、任务提醒、知识问答这些高频工作环节里嵌。

甚至连Notion、Cursor这样的轻量级选手也已经把自己包装成“AI workspace”，主打Agent、Enterprise Search、自动化和知识空间。

Kimi也把钱从API挪到“我替你动用了多少工具、占用了多少环境、持续运行了多久”上：Kimi web search每次调用收费0.005美元，搜索结果token还会继续计费；Kimi Claw的一键云部署则需要Allegretto（每月$31）或更高会员。

市场也用真金白银给出答案：微软这边，2026财年第二季度财报显示，Microsoft 365 Copilot的付费席位已达 1500万个，按标价年化测算约为54亿美元；谷歌则成功实现了Scaling Law到商业利润的转化。根据2026年初的披露，Gemini Enterprise已售出超过800万个付费席位，覆盖超过2,800家大型企业客户。

当然，“喜报”里也有升级为“知识工作执行平台”的Kimi：

据第三方基于Stripe支付数据的追踪，Kimi个人订阅用户1月支付订单数环比增长8280%，2月环比再涨123.8%。在其全球支付榜单上，短短两个月，Kimi排名由百名开外飙升至第9位。

据Gartner（全球最知名的技术研究与咨询公司）判断，到 2035年，agentic AI可能贡献企业应用软件收入的约 30%，规模超过4500亿美元。

于是，一个更清晰的格局开始浮现：大模型公司的终局对手正在快速收敛。

OpenAI、Anthropic、Google、微软，以及月之暗面这样的新玩家，看上去分属不同位置，做的却越来越像同一门生意——把模型接进真实工作流，争夺知识工作的入口、调度权和收费权。也正因此，他们彼此都在改写对方的边界，也彼此成为对手。

这场战争烧钱的速度，与对手的体量成正比，而月之暗面要同时与数家万亿市值的巨头对垒，每一轮弹药补给都是生死线。

图注：月之暗面要同时对垒的巨头们

而最难的是，尽管站在同一片战场上，大家要打的仗却并不一样。

对大多数公司来说，这更像是一场单线推进的竞争：

有的是从既有入口往下压，比如Google、微软、飞书等，它们原本就守着Docs、Sheets、Word、Excel这些现成的入口，AI对它们只是升级，不是开荒；

有的公司选择从模型能力往上爬，比如智谱和MiniMax，皆是以能力层起家，再慢慢往agent和应用层上探。 OpenAI和Anthropic也是同理，先模型后产品，并且如今它们已经占住了开发者和代码助手的高地，可以从容地向外扩张；

而Notion、Cursor、Perplexity这种，它们的优势不是模型一定更强，而是用户原本就在它们那里干活，已经在用户的某个具体工作场景里扎得很深了。

它们各自都有根据地，只需专注在将自己的优势继续放大上。

但Kimi没有。对杨植麟而言，他像是在同时应付几场战役：

它既没有现成的办公入口，也不甘心只做底层能力的供应商。它想让用户直接把工作交给Kimi，这就意味着它不仅要证明模型够强，还要证明用户有理由改变原本的工作习惯。

前一种成本，是训练、推理、Infra和工程；后一种成本，是产品打磨、市场教育、组织渗透和企业信任。这意味着月之暗面要同时承担两条最昂贵的战线：一条是模型军备竞赛的硬成本，一条是用户习惯迁移的软成本。

Google和微软每年在AI上的投入以百亿美元计，但它们的Office 365和Workspace本就是盈利业务，AI投入是“升级存量”而非“创造增量”。

OpenAI虽也无宿主平台，但其C端付费用户数已突破 5000万，月收入约20亿美元，年化收入超过250亿美元；Anthropic近期被报道年化已快速抬升至300亿美元，形成了自我造血飞轮。

月之暗面则不然。它的估值在三个月内从43亿美元飙至180亿美元，创下中国“十角兽”最快晋级纪录之一，但这恰恰说明资本对其“多线作战”能力的极度渴求——

既要养得起K2.5这样的万亿参数模型和端到端强化学习的算力消耗，又要熬得起企业客户从试用到真正依赖的18个月平均转化周期；既要维持C端免费策略以抢夺用户时长，又要搭建企业级私有化部署和API服务体系。

据行业估算，其2024年单年算力支出已超10亿元人民币，而Agent产品的工程化、多模态能力的持续迭代、以及海外市场拓展，都将继续推高这一数字。

更关键的是，这场战争没有终局。模型能力每提升一代，入口争夺就要重新打一遍；用户习惯每松动一寸，就需要持续的产品投入来巩固。短时间内就去IPO，更像是“永远需要更多钱”的注脚。

而比“永远需要更多钱”更紧迫的现实是：它的钱甚至还没找到稳定的来路。

03 道阻且长

如果把这场竞争理解成一场阵地战，Kimi更像是一个火力很猛、意图很靠前的远程兵种：出手快、爆发强、打法直接，但它背后的补给线、原生地盘和容错空间，却远比对手脆弱。

月暗的造血困境，藏在它最光鲜的履历里。

尽管估值已经突破180亿美元，但它的收入规模尚不及对手的零头。2025年，月之暗面C端订阅收入估算约2亿元人民币（数据来自于媒体《光锥智能》），加上API收入也难以触及1亿美元。

即便2026年K2.5发布后“20天收入超过2025年全年”，这种爆发更多反映的是此前基数之低，而非商业模式之稳。

更深层的问题在于，它的用户来得快，去得也快：2024年11月，它的月活是3600万，一年后（2025年Q3）跌至不足千万。

数据过山车的背后，也暴露出杨植麟在运营层面的偏好：更擅长方向判断与关键决策，而非渐进式的节奏把控。

2024年，月暗是行业公认的“投流狂魔”，高峰期每月投放高达数亿元，10月和11月单月投放甚至超过了2亿元。

但到了2025年情况变了。字节、阿里这样的巨头，靠着自己原有的流量入口和产品生态，把拉新成本抬得很高。对月之暗面这种创业公司来说，单靠花钱买用户，越来越像一个填不满的无底洞。

与此同时，DeepSeek又用极高的工程效率，把模型能力的价格迅速打了下来。Kimi早期靠“长文本”建立起来的那点领先优势，也被快速稀释了。

在此背景下，杨植麟的应对不是精细化调优，而是直接“踩刹车”：全面停止投放，暂停多个安卓渠道与第三方广告合作，停更两款出海产品。全员信明确“不以绝对用户数量为目标”。

图注：杨植麟内部信截图

从“烧钱换增长”到“全面收缩”，战术转换大开大合，几乎没有中间过渡地带。这意味着前期投入的人力与资源并未沉淀为可持续的能力，而是随着战略转向直接清零。用户侧更出现真空期：原有C端用户习惯被中断，新用户群体教育尚未完成，品牌能见度骤降。

但问题并不止于此。

比起增长失速更值得警惕的是，月之暗面的收入结构本身，也没有看上去那么扎实，尤其是被寄予厚望的海外业务。

月暗的API收入在2025年底增长4倍，2026年初，随着开源Agent产品OpenClaw爆火，近四分之一的Tokens消耗来自该生态，另有大量调用来自AI编程工具如Kilo Code等第三方编程工具。

也就是说，Kimi的海外收入并非来自自有产品的粘性用户，而是作为底层能力被集成进别人的应用——用户不属于自己，入口也不掌握在自己手里。

图注：OpenRouter数据显示，今年2月，Kimi K2.5模型成为海外市场调用量第二名

这类收入的最大问题在于，议价空间有限，替代风险极高。一旦这些外部产品转向其他模型，收入链将瞬间断裂。

与此同时，它的烧钱速度从未放缓。2025年底对全员进行调薪和期权激励，2026年计划将平均激励翻倍；新增融资明确用于“扩增显卡规模、推进K3研发”。账面现金超过100亿元，却在不到两个月内连续完成两轮超12亿美元融资——

充裕的储备反而印证了造血能力的不足，若自我运转强劲，便无需如此急切地储备弹药。

但这也是战略定位的必然代价：既无现成入口，又未建立稳定的用户付费心智，当对手可以靠既有业务输血、靠生态锁定用户时，月之暗面只能靠自己一轮又一轮地融资，来同时填满两个无底洞。

戴雨森曾透露，杨植麟希望被认可的标签里，“企业家”是其中之一。只不过到今天，这位“天才”身上更鲜明的，仍然是工程师的质地。

在2025年底的那封内部信里，杨植麟把“超越 Anthropic、成为世界领先的AGI公司”写成最重要目标，又强调“不以绝对用户数量为目标，持续追求智能上限”，甚至明确提到“需要一点偏执的审美坚持”。

野心与方向感依然坚定，但反过来看，问题也在这里：一个创始人太相信只要模型足够好，别的问题都会被穿透。

事实上，这种思路不只影响他怎么看产品，也影响他怎么搭组织。因为当“更快、更强、更直接”被放在首位时，组织结构也会自然向极致扁平和高强度沟通倾斜。

公开报道里，杨植麟的个性签名就是“直接沟通”；公司长期坚持极致扁平，没有中间管理层，联创要直接对接40到50位同事。这样的组织当然有速度，也很适合高天赋、高自驱的人，但报道也同时写到：规模一大就会出现信息过载，一些员工会因为缺少清晰反馈和确定性而感到失重。

换句话说，他可能更擅长拉高标准、压缩链路、逼近真相，但未必同样擅长给更大规模的人群提供秩序感、安全感和可持续的管理结构。

一个人被过早放进“神中之神”的叙事里，市场就会天然高估他的确定性，低估一家公司真正要面对的复杂性。

杨植麟信奉一句话：“Problems are inevitable, but problems are soluble.” （问题是不可避免的，但问题也都是可以被解决的），这句话出自近年来被硅谷追捧的一本书：《The Beginning of Infinity》，这本书是由物理学家David Deutsch撰写的。

巧合的是，有批评者认为，Deutsch的这本书低估了组织、政治、人性在知识传播中的摩擦成本——这正是杨植麟这类技术理想主义者容易忽视的维度。

在回答张小珺“为什么AI产品还没有形成数据飞轮”时，杨植麟是这样解释的：

“因为基于算力的scaling太强大了……另一方面，所谓的数据飞轮是很依赖外部环境的feedback(反馈)，这个feedback我们不希望它有很多的噪声，但现在可能somehow还没有把这个问题解决的很好，大模型的学习对噪声还是比较敏感的，跟传统的推荐系统不太一样。”

简单理解就是：在当下这个阶段，算力扩张和强化学习带来的能力提升仍然十分明显；相比之下，让模型直接从复杂、嘈杂的用户反馈中持续学习，这条路还没有被真正跑通。

某种程度上，这种对“内部确定性”的倚重，也延伸到了杨植麟看待外部世界的方式里。

他曾说，要在“自己的故事里去感受自己是个什么样的人”。这句话未必是一种回避，更像是他处理不确定性的方式：当外界围绕投放、留存和商业化不断提出疑问时，他更愿意回到自己更熟悉、也更相信的那部分东西——技术迭代、能力提升，以及内部逻辑的持续自洽。

但月之暗面终究会走向更大的舞台。Scaling Law的红利也许还没有结束，可一家公司能不能走远，终究不只取决于模型本身。再往后，真实世界的反馈、团队的承接和商业的耐心，都会成为同样重要的变量。

对杨植麟而言，这或许也是另一门课：如何让技术之外的部分，也慢慢长出来。

01

光环

02

怎么会不缺钱呢？

03

道阻且长

相关新闻