不能只算token账

来源：36kr 4 小时前

1

Anthropic禁止订阅用户通过龙虾等第三方工具接入后，小米大模型团队负责人罗福莉凌晨发了篇帖子讨论这事。

主要内容可以概括为两点。

第一，A社的做法虽然会短期推高使用成本，如果用户继续使用Claude模型，但长期来看会带来很好的工程纪律。

工程纪律的意思是，社区会因为模型成本上升，在开发产品时做更合理的工程优化来提升token的使用效率。

这里她点名批评了龙虾，上下文管理做得很拉胯，一个用户请求会触发多轮工具调用，每次都是携带长上下文的独立API请求。

第二，她呼吁模型厂商不要打价格战，不要靠低价吸引用户入坑后，又用缩水的模型和不稳定的服务去损害体验。

我们前两天写了篇文章，《小米这次也没把价格打下来》，其中提到MiMo Token Plan目前价格相对其他厂商同等套餐偏贵。

罗福莉没有直接承认这点，但间接回答了这个问题：小米的目标是“长期稳定地交付高质量的模型和服务 —— 而不是让你冲动付款，然后弃船。”

我们之前文章里提到，MiMo套餐偏贵的事实其实跟小米给大众的主流印象是有差距的，毕竟观众更熟悉性价比叙事。

但这也不是小米搞AI后就变了，小米这个定价肯定也谈不上赚钱，只是在其他选手亏损搞token倾销的时候，选择了更贴近成本的定价策略。

token倾销这个词可能有点重，因为要是以低于成本售卖AI服务这个标准看，目前行业里基本没谁能逃得过。

但有些玩家定价的确相当激进，低价吸引用户过来后保证不了体验，比如我就遇到过某家套餐服务卡顿甚至不可用的情况。

大模型跟其他传统互联网产品不同。传统互联网产品边际成本可以不计，用户翻倍成本增加很少。大模型产品成本跟用户规模比例扩张。

而且还因为是非标品，厂商很容易在背后做手脚，稍微降点智用户不容易察觉，察觉到也没有实际证据。

当然，即便存在这些一些问题，我仍然认为模型厂商价格战是利大于弊的，是双赢的局面。

用户客观上因为价格战得到了便宜，这是加速新技术采纳的决定性因素。

DeepSeek去年的模型并没有在能力上超过GPT或者Claude，但R1的意义仍然没有被高估，因为把成本降低几十倍对技术普及的促进必然强于某个增量SOTA模型。

至于亏钱卖token不可持续，我只能说不是现阶段二线厂商配考虑的问题。

Anthropic模型能力顶尖，产品体验差异化，所以哪怕经常封号拔网线也一堆用户求着交钱。

彭博上个月报道，Anthropic当时年化收入已经达到200亿美元，相比去年底翻倍还多，这个夸张的增长速度隐隐有取OpenAI而代之的意思了。

但二线厂商之间模型能力并没有拉开差距，不同厂商轮流领先，性价比是不得不走的路子。

罗福莉评价是对的，龙虾就是vibe coding出来的一堆屎山。

因为是屎山，所以它没有架构设计，没有工程优化，天生就浪费效率。

但它能火起来，能让一堆专业的非专业的用户愿意用，就已经算是功德无量了。

所有二线厂商都应该给龙虾磕一个，我很难想象没有龙虾他们得多努力才能证明自己的价值。

这是OpenRouter上不同模型的使用统计。

在龙虾火爆之前，你在这个排行里根本看不到二线模型厂商，除了硅谷御四家，其余全是others。

但现在排行榜前几名，已经被阿里、小米、阶跃星辰的模型占满了。

话说新模型出来，免费放OpenRouter上吸引大家用一用，已经成为国内厂商的惯例。OpenRouter现在已经沦为PR前沿阵地。

这两天阿里发布Qwen3.6，宣传登上OpenRouter排行榜首。小米MiMo之前也宣传登顶了OpenRouter。都是免费试用。

某种程度上说，龙虾耗token甚至可以理解成是feature。

大模型研发门槛很高，但大模型供给一直以来都是不稀缺的，因为用户不需要那么多模型。龙虾把性价比放大成了真正的竞争力。

简单拉下数据。MiniMax去年总收入7900万美元，龙虾爆火后2月ARR已超1.5亿美元。月之暗面发布K2.5模型后，不到20天收入超去年全年，且海外收入首次超过国内。

AI的确在推动各个产业发生变革，不过就AI自身而言，至今为止都还没有跑通独立的盈利模式。OpenAI和Anthropic收入在快速增长，但能否覆盖巨额研发和资本支出仍有疑问。

至于智谱、MiniMax和月之暗面们，距离闭环的商业模式就更为遥远了。

这种情况下，叙事成为生存的要义。叙事不能只靠画饼，模型厂商的第一性原理就是模型得有人用。

没人用，叙事就崩塌了。有人用，越来越多人用，叙事才会变得圆满。

去年底，月之暗面估值43亿美元，现在正以180亿美元寻求融资，翻了四倍不止。智谱今天收盘780港币，是1月份IPO发行价116港币的6.7倍。MiniMax的IPO发行价是165港币，现在股价是950，也是翻了快6倍。

不能只算token账。

2

二线模型厂商在成本和规模压力下，已经有提价动作。但这暂时不会达到摆脱价格战的地步。

小米的处境比较特殊，它有自己完整的产品矩阵和硬件生态，MiMo的第一使命是融入并改造这个现有生态。哪怕不对外卖token，小爱同学、智能手机、小米汽车、IoT设备生态，MiMo都能有大有作为的空间。

智谱、MiniMax、月之暗面们则处在另一个处境。它们有C端产品，但这个赛道竞争极其惨烈。目前看来独立的AI产品，无论是通用助手，还是细分赛道，字节、腾讯和阿里都有碾压性的优势，也有争夺的意志。

相较之下，API卖token的生意看起来好一些，虽然好得有限。因为这只关乎模型质量，而腾讯和Meta的经验表明，模型研发不只是钱和资源的因素。

但龙虾窗口期不会无限延续。

如果龙虾只是一阵风，过段时间随风而逝，那自然二线厂商也就不能指望这个出货渠道了。

如果龙虾代表的不是一个工具的短暂流行，而是C端AI产品的一种范式，那大科技公司一定会出手。

这些公司有流量、有分发、有用户信任，它们会以自己的竞品收割市场，并且会优先使用自己训练的模型，而不是采购二线厂商的API。

模型跟产品的结合是大趋势。阿里打通千问App跟通义模型研发团队，搞出了组织调整和人事出走风波。姚顺雨入职腾讯，也是首先做团队整合，不同研发部门之间的整合以及研发跟产品的整合。

罗福莉批评龙虾耗token，提到Claude Code更节省上下文的工程设计，这是另一个产品需要跟模型打通的案例。

龙虾架构上的天然缺陷，意味着每次工具调用都携带完整的长上下文发起独立请求，用户的一个操作可能在后台触发十几轮API调用。这不仅烧token，也制造延迟，制造不稳定。

Claude Code对上下文做精细管理，知道什么时候该压缩历史，什么时候该截断，怎么在保留任务状态的同时减少冗余信息的传递。

这背后是Anthropic对自己模型能力边界的深刻理解。只有模型研发者，才能把产品和模型调优成浑然一体的东西。

AI产品的第一代范式是，模型作为通用API，产品套在外面。这个范式催生了龙虾，也催生了无数套壳应用。它降低了创业门槛，但也带来了巨大的效率浪费。产品不理解模型，模型不适配产品，两边都在用蛮力弥补彼此的信息差。

如今第二代范式正在浮现：模型与产品深度整合，从架构层面共同设计。Claude Code是一个样本：模型不再是被调用的服务，而是产品本身的一部分。

这个趋势下，纯粹的模型API厂商面临的压力会越来越大，没有产品可能成为它们的致命缺陷。如果竞争力来自模型与应用层的深度整合，那API层的价格竞争就是一场慢性消耗。

行业一直喜欢说模型即产品，用这句话强调模型的基础作用和重要性没问题。但除非你的商业模式是只卖API，否则模型始终是产品的组成部分，而不是产品的全部。

1

2

相关新闻