文 | 象先志
百度又调整了AI组织。
最新变化是,设置百度模型委员会BMC。此前新成立不久的基础模型研发部BMU、应用模型研发部AMU,将向BMC 汇报;相关部门同时仍向百度CEO 李彦宏汇报。
按照公开信息,BMC 的成员由年轻、对大模型有深刻理解的研究员构成,将统筹百度大模型基础模型和应用模型的研发工作。
BMC在BMU和AMU之上加了一个统筹协调层,标志着自去年成立模型研发新部门之后,这套组织架构正式成型。
这次调整的真正含义是:李彦宏正在百度内部画出一块AI自留地。
这块地更年轻,更贴近大模型研发一线,也拥有一条更短的决策链路。它要绕开的,正是百度过去很多年里反复暴露出来的老问题:机会如雨点撒来,但百度都一闪而过。
先知先觉的百度
百度从来都是一家先知先觉的公司。
在中国互联网公司里,百度是最早系统性押注AI的公司之一。无论是智能音箱、自动驾驶,还是后来的大模型,百度都不是等别人跑出结果后才仓促跟进。很多时候,李彦宏对技术趋势的判断甚至是偏早的。
但这也正是百度最尴尬的地方。
如果一家公司一直没有看见趋势,它的问题很简单;如果一家公司总是很早看见趋势,却总是在结果出来时显得落后,问题就复杂得多。
百度过去几年被反复概括为“起大早,赶晚集”,这句话之所以流行,是因为它击中了百度AI叙事里的核心矛盾:方向感并不差,交付结果却总是不够硬。
李彦宏很早强调AI,很早讲智能体,也一直试图把AI竞争从单纯的模型能力,拉向应用和生产力。但问题在于,百度交出来的产品和模型,很多时候没有撑住他的判断。
最典型的例子,是过去两年关于开源和闭源的争议。
李彦宏曾经因为开源模型没有机会、闭源模型才有前途的判断,被外界反复讨论。但如果把视角从国内舆论场拉到全球大模型商业化,这个判断并非完全站不住。
OpenAI、Anthropic、Google等公司所代表的主流商业模型路径,本质上都在证明这点。闭源模型可以形成壁垒、价格体系和商业收入。
今天再看,国内大模型公司的开源和商业化策略也并不是简单地一路开源到底,阿里调整开源策略,豆包准备实行付费计划。
如果文心大模型在能力、体验和行业口碑上都明显领先,李彦宏关于闭源的论断会显得顺理成章。但当外界感知到的是文心没有足够强的统治力时,一个本来可能成立的商业判断,就反过来变成了嘲弄的物料。
这说明李彦宏的问题未必是完全看错了方向,而是他可能高估了百度自身的模型能力。
高估从哪里来?很大程度上来自组织内部的信息输入。
一个CEO对公司核心能力的判断,不可能只靠自己坐在办公室里试产品。他依赖汇报,依赖内部评估,依赖层层传递上来的研发进度、模型指标、产品反馈和竞争判断。
如果这些信息被组织惯性过滤和包装过、乐观化过,最终到达他面前的就不是真实世界里的百度。
这就是理解BMC的背景,也是理解BMU和AMU的背景。
留块自留地,绕开旧体系
BMC最值得注意的地方,是汇报关系和“年轻研究员”。
这几个字比“委员会”本身更重要。因为它说明百度并不只是想用一个更高层的管理人员做协调,而是在试图让真正理解大模型的一线技术人员,进入更靠近决策中心的位置。
这背后至少有三层含义。
第一,百度希望减少传统管理链条对技术判断的过滤。
大模型研发不是一个适合层层转述的领域。模型路线、训练数据、算力分配、后训练策略、应用反馈,每一个环节都变化很快,也都非常依赖一线判断。如果决策层听到的主要是经过多层加工的总结,很容易错过真正关键的技术细节。
让年轻、懂模型的研究员进入BMC,意味着百度希望把一线研发判断抬到更高位置。它并非单纯的年轻化姿态,而是试图改变信息抵达李彦宏的方式。
第二,这接近AI创业公司的组织气质。
过去几年,全球最强的一批AI公司,很多并不是传统大公司的典型组织形态。它们的核心技术判断,经常来自非常靠近模型训练和产品迭代的一线团队。研究、工程、产品、商业化之间的距离很短,方向错了可以快速改,能力不足也很难被长期掩盖。
国外巨头基本没有做模型的声量,能力限制和主动选择都是因素。唯一做出成绩的谷歌,也依靠DeepMind作为相对独立的研发设施。
百度作为一家成熟大公司,很难完全复制创业的结构。但BMC至少是在向这个方向靠近:让模型研发不再完全沉在既有组织层级里,而是形成一条更短、更直接的路线。
第三,这是对百度过去内部信息链条的一种修正。
如果百度过去的问题是“起大早,赶晚集”,那它要反思的就不能只是战略层,而必须反思执行层、反馈层和判断层。李彦宏需要知道真实的模型能力到底在哪里,真实的产品体验到底如何,真实的竞争差距到底有多大。这些信息越经过层层汇报,越容易失真。
BMC的设置,本质上是在缩短这个距离。
这里还可以看到一个更微妙的信号:百度传统AI 技术体系长期与王海峰相关,但BMU、AMU以及现在的BMC,都是直接面向李彦宏的大模型线。它至少说明,李彦宏希望把大模型研发从百度既有技术管理体系里单独拎出来,形成一条更短、更直接的决策链条。
BMU和AMU本来就不应该是割裂的。
BMU做通用基础模型,AMU做更贴近应用的专精模型和能力。表面上看,一个偏底座,一个偏场景;但在大模型时代,两者天然互相依赖。
一个编程类应用能不能做好,不只取决于应用层怎么设计,也取决于基础模型在代码能力上的起点。这个起点又会反过来影响训练数据权重、评测体系和模型路线。
如果基础模型团队只追求通用指标,应用模型团队只在后端补能力,两者之间就会出现断裂。BMC的价值正在于此:它试图把基础模型研发、应用模型研发和业务落地放进同一套统筹机制里。
所以,BMC、BMU和AMU更像是一种内部创业机制。
李彦宏在百度内部画出一块AI自留地,因为他可能已经意识到,原有组织体系很难自然长出他想要的大模型结果。既然这套现有体系靠不住了,那就试试以内部创业的形式搞某种程的“单干”。
BMC 重组队伍,DAA 定义规则
在Create 2026上,李彦宏对外抛出了另一个概念:DAA,Daily Active Agents,日活智能体数。
李彦宏想表达的是,AI时代不能只看有多少人烧了多少token,更要看有多少智能体在替人完成任务。移动互联网时代,DAU是一个核心指标;但到了智能体时代,Agent就是参与主体。
这个方向有启发。
如果AI的价值不只是回答问题,而是替人执行任务,那么衡量标准确实应该从“人访问了多少次”,转向“机器完成了多少工作”。在这个意义上,DAA是百度试图为智能体时代提出一套新计分方式。
但 DAA也有问题。
agent本质上仍然是被赋予一定智能的程序。只要愿意拆分、部署和运行,agent的数量可以被迅速做大。一个agent 是否真的创造了价值,不能只看它是不是“活跃”。
相反,低质量agent甚至可能制造噪音。
社交媒体上的AI评论就是一个很直观的例子。它们表面上增加了互动,实际上却未必提供新的信息、经验和判断。用户之所以看评论,是为了获得自己单独思考时无法得到的补充。
如果评论只是大模型可以随手生成的套话,它增加的是注意力负担。我要看AI回复,那我直接问AI不就行了。而且大概率用来跑agent 的不是最顶尖的模型,我自己问,想问opus 4.7就问,想问gpt5.5 也行。
李彦宏说token 代表成本,不代表产出,这话有一部分道理。token消耗本身确实不能说明任务是否完成。但反过来说,token 是付费资源,是实实在在的成本。
企业和用户愿意持续为token买单,已经说明它在某些环节创造了价值。钱仍然是最有效的衡量尺度之一,付费就是最强的产出认可度。
DAA 可以某种程度上被理解为百度争夺AI应用时代话语权的一次尝试。
它和BMC放在一起看,才更有意思。
Create 2026上,百度对外说的是:AI竞争不应该只看模型榜单、参数、token和聊天机器人的DAU,而要看智能体是否真正完成任务。
这是百度想重新定义外部比赛规则。
BMC则是百度对内做的动作。如果未来竞争真的要看智能体能否持续交付,那么基础模型、应用模型、训练路线和业务落地就不能彼此割裂,并且要用另起炉灶的方式保障资源、效率和信息传递。
这是李彦宏在重组内部参赛队伍。
但百度这里缺了一环,原生AI应用场景。
百度App、搜索、百度网盘、百度文库,都有用户、有数据、有场景。问题在于,这些产品大多形成于上一代互联网周期。它们的功能、用户心智和商业模式早已成型,AI可以改造它们,但这种改造更多是在既有功能上的增强。
秒哒、DuMate、伐谋、一镜,构成了百度在Create 2026上展示的智能体矩阵。它们让百度的AI应用叙事变得完整:有通用智能体,有代码智能体,有决策智能体,也有数字人智能体。但它们还需要证明自己是稳定、高频、能充分激发付费能力的真实应用。
组织可以重建,应用场景不能靠组织架构自然长出来。
这是BMC的边界,也是百度接下来真正要面对的问题。

