拿“Codex”当馅儿，豆包才值钱

来源：凤凰网 12 小时前

OpenAI刚刚给字节上了一课。

据《金融时报》披露，OpenAI正准备对ChatGPT进行自2022年推出以来规模最大的改版。新版ChatGPT会把Codex、外部合作伙伴应用和 Agent能力更深地接进来，把原本的聊天框，改造成一个能写代码、管理日程、操控软件的“超级应用”。

OpenAI的方向很清楚，要把ChatGPT从聊天框变成一个任务分发入口。用户还是从ChatGPT进来，但背后接上的东西会更多。Codex负责执行更重的任务，外部应用接入真实服务，插件和Agent把需求往下推进。

豆包在国内的位置其实和ChatGPT很像。

ChatGPT之于OpenAI，豆包之于字节，都是最大众、最容易被用户自然打开的AI入口。

与此同时，豆包正处在从免费AI助手到付费专业AI工具的关键转型期。

按照官方说明，针对专业人群的生产力需求，豆包计划推出专业版，将包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。

豆包也强调，搜索问答、写作生图、语音和视频对话等日常功能，会继续保持目前的免费服务；专业版的服务，也会在一定额度内免费。

豆包收费这件事，本身并不算新奇。AI产品本来就不便宜，ChatGPT、Claude、Gemini都有付费会员，模型API也都是明码标价。字节自己旗下的Trae、扣子、即梦AI，也早就有付费选项。

但豆包的问题在于，它靠什么让别人为它付钱。

如果只是一个升级版的豆包Chatbot，“贵又难用”的评价恐怕要再次冲上热搜。尤其当它明确表示专业版瞄准的是“软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究”这些生产力场景时，它要回答的，自然也不再是那些针对Chatbot的问题。

字节不缺用户入口，也不缺技术资产。豆包有入口，扣子有Agent和工作流，Trae有编程工具，飞书有企业协作场景，Seed有底层模型和多模态能力。单看每一块，字节都有东西可讲。

问题在于，这些牌能不能像ChatGPT和Codex那样串起来。

豆包付费版，卖的是什么？

豆包正在走到一个新阶段：从免费的AI助手，变成要收费的专业工具。

过去一年，豆包在国内AI助手里遥遥领先。

CNNIC《生成式人工智能应用发展报告（2025）》显示，截至2025年6月，我国生成式AI用户规模达到5.15亿人，普及率达到36.5%。在主要产品中，豆包的用户使用率达到72.2%，位居第一；在“首先选择使用的产品”中，豆包占比47.1%，位居第一。

QuestMobile的数据也能说明豆包的入口优势：2026年3月，豆包月活达到3.45亿，超过第二名千问1.66亿的两倍；一季度平均活跃率达到33.5%，高于千问的17.1%和DeepSeek的21%。

豆包能在普通用户里迅速推广，靠的主要是免费、好用、功能多、无门槛。用户打开豆包，可以搜索问答、写作生图，还能语音和视频对话。它像一个随手可用的AI助手，负责陪用户聊天、回答问题、处理一些轻量任务。

但这套逻辑只能支撑免费版本，一旦涉及到付费，用户的需求就会截然不同。

按照豆包官方说法，专业版面向的是专业人群的生产力需求，覆盖软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等方向。

工作场景和日常聊天不同，用户问一个日常问题，AI回错了，大不了重新问；让AI写一段文案，不满意也可以再改。但涉及到软件开发、数据分析、金融分析、科学研究，用户的容错率会低很多。效率即成本，付费产品必须给出更清楚的价值。

事实上，即使在免费阶段，豆包也已经因为“看起来能办事，但实际上没办成事”引发过争议。

比如此前的餐厅订座事件。有用户通过豆包预约餐厅，豆包生成了看起来很像预约成功的回复，甚至让用户到店报出时间和人数。但用户到店后，商家表示并没有收到有效预订，称豆包只是AI对话工具，模拟输出并不会同步到门店系统。豆包客服后来也回应称，目前无法帮用户预订或购买商品。

还有5月中旬的“豆包机票退款”事件。一名用户称，自己向豆包咨询机票退票手续费，豆包给出“仅收5%手续费”的明确回复，但实际退票时被扣除40%手续费，损失600元。随后，用户称豆包又在对话中承诺赔付，后续索赔无果，于是向法院起诉豆包运营公司。豆包相关负责人回应称，该案例相关问题已处置，之后在涉及金融、退款等场景会有风险提示。

免费阶段，用户还可以把这类问题归为AI幻觉；而一旦进入付费场景，AI产品暴露出的可靠性问题会更加严重。

但反过来看，付费版本也起到了筛选用户的作用。

免费阶段，豆包面对的是最宽泛的用户，处理的是搜索问答、写作生图、语音和视频对话等日常需求。这些功能在后续依然会保持免费服务，那些轻度的AI用户，本身其实并不受专业版的影响。

据全球人工智能市场追踪机构Aicpb.com发布的数据显示，在豆包预告专业版之后，豆包App 5月月活减少约610万，环比下降1.81%。这组数据后来被放进“豆包商业化是否过早”的讨论里，对这一点我其实持保留态度。5月月活下滑当然值得观察，但把它直接归因于“用户不愿为豆包付费”，证据并不充分——专业版都还没有正式推出。更可能的情况是模型体验感下降、竞品分流、外界对收费传闻的观感变化等多重因素共同作用。

我们有理由相信，那些轻信AI幻觉、把AI当成万能工具的用户，并不是专业版的付费受众。真正愿意为专业版付费的人，反而更清楚AI的边界，也更在意它能不能稳定完成任务。

从免费入口到付费AI工具，定位的变化同时也会带来用户结构的调整：免费阶段看的是规模，专业版阶段拼的是付费意愿和真实需求。

这对豆包是机会，也是压力。机会在于它可以从“全民尝鲜”的流量池里筛出真正有生产力需求的人，压力在于付费用户会更加挑剔。

所谓光脚的不怕穿鞋的，免费的豆包可以随时“滑跪”，通过说俏皮话的方式回避一些错误，用户顶多骂一句，骂完继续用。但在付费产品中，这种策略很难行得通。

用户为专业版付钱，可不是为了看它认错态度好，而是为了让它把事情办成。尤其在软件开发、数据分析、金融分析、流程自动化这些场景里，结果能不能用，比回答漂不漂亮重要得多。

OpenAI为字节打了个样

豆包专业版要解决的这个问题，OpenAI刚刚演示了一遍。

《金融时报》披露，OpenAI正准备对ChatGPT进行自2022年推出以来规模最大的改版。新版ChatGPT会把Codex、外部合作伙伴应用和Agent能力更深地接进来，把原本的聊天框，改造成一个能写代码、管理日程、操控软件的“超级应用”。

OpenAI正在把ChatGPT从一个聊天框，改造成任务分发的主入口。用户还是从ChatGPT进来，但背后接上的东西变多了：Codex负责执行更重的任务，外部应用负责接入真实服务，插件和Agent负责把需求往下推进。

据报道，改版初期，ChatGPT的网页端和移动端会增加大量提示词和功能入口，引导用户去使用编程工具、图像生成，或者调用Canva、Booking.com等外部合作伙伴应用。用户也会看到一个选项，可以手动选择让Codex还是ChatGPT来回应需求。

换句话讲，OpenAI做的不是一口气把所有东西都塞进一个聊天框里，让用户自己猜怎么用，它会在前期主动把入口摆出来，让用户知道：这里可以写代码，那里可以生成图像，也可以调用外部应用。等用户习惯之后，OpenAI再逐渐减少这些显性的提示和入口，让模型自己判断任务应该由哪个工具完成。

无论是改版还是改版方式，OpenAI的做法都很值得豆包学习。

OpenAI本质上是在把已有的两类资产接到一起：一类是ChatGPT这样的超级入口，一类是Codex这种更容易产生付费价值的工作工具。

《金融时报》援引知情人士称，Codex主要吸引的是付费客户；企业客户目前约占OpenAI收入的40%，预计年底会升至50%。与此同时，ChatGPT已经有约9亿周活用户和超过5000万付费消费者。

ChatGPT有规模，Codex有付费能力。OpenAI正在做的，是让规模入口承接更重的工作能力，再把这些能力转化成更强的付费理由。

Codex自己的增长也证明了这一点。OpenAI官方披露，Codex周活已经超过500万，自2月桌面App发布以来增长超过6倍；开发者仍然是最大用户群，但知识工作者已经占到约20%，而且增长速度是开发者的3倍以上。

可以认为，执行型AI已经开始从开发者圈层向更广泛的知识工作者扩散。

而豆包缺的正是这个环节。

字节手里其实有一套很完整的AI生态。豆包是大众入口，扣子负责Agent和工作流，Trae面向编程和开发者，飞书承接企业协作，火山引擎面向云和企业服务，即梦、星绘、小云雀、猫箱覆盖图像、视频、角色互动和内容创作，Seed则在最底层提供模型和多模态能力。

每个工具单独看都有价值，但如果要让用户为了一个任务开好几个会员、在几个产品之间来回切换，想想都觉得麻烦。

OpenAI的做法给了字节一个提醒：要真正进入工作场景，不只在于把模型做强、把工具做好，还可以打通各个环节，把入口做顺。

ChatGPT没有变成Codex，但它开始承接Codex的能力。豆包也不用变成Trae或扣子，但它应该把Trae、扣子、飞书这些能力接到自己后面。

类似的事情豆包并不是没有做过，在内容创作上，它已经接入了图像和视频生成能力。豆包专业版要做的，是把这种接入方式，从图像、视频创作，扩展到更复杂的工作工具上。

豆包专业版的想象空间就在这里，它不应该只是一个更强的聊天框，还应该成为字节AI能力的总入口。用户从豆包开始，把需求说出来，后面的Agent、代码工具、办公协作、云服务和模型能力自然接上。

比较理想的形态是，用户在豆包里提出一个开发需求，后面可以由Trae接住；提出一个自动化需求，后面可以由扣子拆任务、跑流程；涉及团队协作，结果可以进入飞书；涉及企业服务和模型调用，则可以接到火山引擎。用户看到的仍然是豆包，但背后跑起来的是字节自己的工具链。

到这一步，豆包专业版卖的就不只是“更聪明的回答”，更是把事情往前推进的能力。

任重而道远

字节其实没有别的路可选，豆包专业版既然要做软件开发、数据分析、流程自动化、金融分析、科学研究，就必须从聊天走向执行。

方向是清楚的，但问题也很明显：入口和工具接起来之后，背后有没有足够硬的能力。

现在看，字节手里的工具并不少。Trae面向编程和开发者任务，扣子主打Agent和工作流，飞书扎在企业协作场景里，火山引擎负责云和企业服务。它不是没有产品，也不是没有生态，但缺少一个像Codex之于ChatGPT那样清晰的执行器心智。

Codex被OpenAI“放进”ChatGPT的根本原因，在于它已经有了足够强的产品存在感。用户知道Codex能在编程和工作任务里带来效率提升，OpenAI把它接进ChatGPT，是把一个已经被市场验证过的生产力工具，放到更大的入口后面。

但Trae和扣子还没有走到这一步。Trae是字节在AI Coding上的重要产品，但在开发者心智里，它还没有像Claude Code、Codex那样成为明确的生产力符号。扣子有Agent、工作流、插件和知识库能力，很适合做豆包专业版背后的任务底座，但它目前更像一个给会搭建的人用的平台，还没有变成普通用户可以自然感知的执行能力。

豆包专业版要接入Trae和扣子，也并不是把几个产品入口摆在一起就够了。用户在豆包里提出需求后，开发、自动化、数据处理、文档协作这些能力要能顺着需求自然接上。至于背后跑的是Trae、扣子还是别的工具，用户未必需要知道。

工具层还只是第一关，再往下走，就会碰到底层模型能力。

豆包专业版瞄准的是真实工作场景，对模型的要求远高于普通聊天。尤其是Coding，软件开发可能是专业版里最容易被验证的能力。它不像普通问答可以靠语气和表达弥补，代码跑不通，结果就没有意义。

AI Coding是最早被验证的生产力场景之一，也是最容易让用户形成付费判断的场景。能不能写出可用代码，能不能完成真实开发任务，直接决定用户会不会觉得这个工具值钱。

在这一点上，字节也还没有形成明显优势。用户提到代码能力，可能会先想到DeepSeek、Kimi、智谱、MiniMax，而不是字节的编程模型。

DeepSeek最近在Agent、Coding 相关方向上的动作变得更明显，智谱也一直在强化Agent、开发者工具和企业场景，MiniMax则在多模态、Agent和工具调用上持续推进。它们都在在争夺真正能产生生产力价值的场景。

字节的优势是生态，但生态优势要变成商业优势，前提是模型能力和执行工具都要足够强。否则，入口再大，也只是把更多用户带到一个更贵的聊天框前；工具再多，也只是让用户在不同产品之间来回切换；生态再完整，也很难变成真正愿意付费的生产力系统。

或许这也是豆包专业版在当前并没有很被看好的原因，外界不是完全不理解字节为什么收费，只是在等它证明：豆包到底能不能从一个免费AI助手，变成一个付费生产力入口。

但至少方向是清晰的。模型能力可以慢慢补，工具心智可以慢慢建立，用户习惯也可以慢慢培养。字节现在最应该先做的，是学习ChatGPT的转型方式，把已有的生态打通，让豆包成为能调动扣子、Trae、飞书、火山引擎和Seed能力的总入口。

这条路不会轻松，但它必须走。

相关新闻