梁文峰和姚顺雨,四月交卷
来源:凤凰网 18 小时前

撰文|画画

2026年4月,中国AI圈将迎来一次罕见的同台竞技。

DeepSeek V4,梁文锋打磨已久的多模态大模型,计划正式上线。

几乎同一时间,腾讯混元新模型也将发布,负责人是姚顺雨,2025年底刚刚回国,顶着腾讯总办首席AI科学家的Title走马上任。

两家公司,一南一北,一个初创,一个巨头。

一个是用量化私募思路颠覆了AI行业的理工男,一个是被腾讯用最高规格从海外请回来的学术派。

他们几乎不可能在同一张牌桌上出现,但4月,他们都要交卷。

这不是巧合,这是一个节点。

1、腾讯的那个决定

要理解4月意味着什么,必须回到2025年初腾讯做的那个决定。

彼时国内大模型市场,百度有文心,阿里有通义,字节有豆包,各家都在跑马圈地。腾讯混元排不进第一梯队,产品端的元宝几乎没有存在感。

就在这个时候,腾讯选择在元宝里接入DeepSeek。

这个决定在当时被很多人解读为务实之举,与其死撑自研,不如先用最好的模型把用户留住。

但它同时也是一个承认:在大模型能力这件事上,我们现在不如一家创业公司。

元宝的数据验证了这个决定的正确性。

接入DeepSeek之后,用户和活跃度明显回升。这是腾讯用流量换了时间,用元宝已有的产品生态和微信QQ的导流能力,换来了姚顺雨团队自研模型的窗口期。

但时间窗口终究有限。一旦混元最新的版本上线,腾讯面临的第一个真实问题是:留在元宝里的用户,到底认的是哪个名字?

这不是能靠市场调研回答的问题,它只能靠4月之后的留存数据来回答。

2、DeepSeek的另一道难题

DeepSeek这边,面对的是一种完全不同性质的压力。

V3发布之后,DeepSeek的数字是这样的:上线至2025年2月9日,累计下载超过1.1亿次,周活跃用户最高接近9700万。

这个量级,已经接近Twitter在鼎盛期的日活水平,对于一个发布不到半年的AI应用,当时几乎没有先例。

更大的影响发生在行业层面。V3发布后,英伟达单日市值蒸发约6000亿美元,美国科技圈开始重新讨论算力军备竞赛的逻辑是否成立。

DeepSeek用一个开源模型,在成本和效率上同时挑战了大模型必须靠暴力堆算力的行业共识。

但这组数字和这段叙事,也同时变成了V4必须背负的重量。

市场对V4的预期,不是比V3更好,而是能不能再次重新定义。这是一个很难完成的任务,因为V3已经把天花板拉得很高。

梁文锋选择的应对方式,是让V4的迭代方向足够具体,而不是继续打效率革命的旗号。

从论文节奏看,这个准备早就开始了。

2025年12月,署名包含梁文锋团队的《mHC: Manifold-Constrained Hyper-Connections》发表,方向是底层架构的连接方式优化;

2026年1月,梁文锋署名的《Conditional Memory via Scalable Lookup》提出条件记忆机制,在推理过程中,模型可以根据条件动态检索和激活相关记忆,而不是把所有历史上下文都塞进一个固定窗口里。

这两篇论文,距离V4发布只有几个月。它们不是学术展示,更像是产品路线图的技术背书。

V4还有一条线被单独提出,深度适配国产芯片,并有望成为首个完全运行在国产算力生态上的顶级大模型。

在此之前,所有顶级大模型的训练和推理都高度依赖英伟达的GPU。华为昇腾、寒武纪等国产芯片在性能和软件生态上与英伟达仍有差距,适配工作远比听起来复杂。

如果V4真的跑通了,意味着中国大模型产业链上最关键的一环,算力依赖第一次出现了可被验证的替代路径。

3、两条路,同一个终点

有意思的是,DeepSeek和腾讯在技术路线上正在往同一个方向收拢:长上下文、长期记忆、Agent可用性。

这不是巧合,这是整个行业正在形成的共识。下一代AI竞争的核心,不再是谁的参数更多,而是谁能真正记住用户、理解上下文、在复杂任务中持续工作。

但两家公司走向这个终点的路径截然不同。

DeepSeek的做法是从底层架构动刀,条件记忆机制是要在模型本身的记忆方式上做根本性改变。

腾讯的做法是先定义评测标准,CL-bench提出了一套衡量上下文学习能力的新基准。

如果这套标准被学术圈和行业接受,腾讯就获得了一个叙事上的主动权:你的模型好不好,要按我定的标准。

两种路径,代表了两种不同的竞争策略。做出更好的产品,和定义什么叫更好的产品,是两件事。

历史上,后者有时候比前者活得更久。但前提是,你定的标准得被别人接受。如果DeepSeek V4的能力直接碾压了CL-bench设定的评测维度,那套标准就只是腾讯的自我评分。

4、四月之后

4月会到来,两张考卷会被打开,市场会给出它的判断。

但真正值得追问的问题,比谁的模型更好要复杂得多。

第一个问题:腾讯能不能接住用户的切换?

从接入DeepSeek到推出自研混元,这条路如果走通,腾讯的体量、数据、场景接入,微信、QQ、腾讯视频、游戏、企业微信,一旦有了够用的底座,这些场景的价值才能被真正释放出来。

但如果切换之后用户留存下滑,腾讯可能需要重新评估自己在这场竞争里的位置。

第二个问题:DeepSeek能不能守住国产第一的位置?

V3之后,DeepSeek已经不只是一个产品,它是一个标准、一种叙事。

V4需要证明,这不是偶然,而是一种可持续的能力。

尤其是在国产芯片这条线上,如果跑通了,DeepSeek将拥有一个其他顶级大模型都没有的叙事,而这个叙事的价值,可能比模型本身还要大。

第三个问题,也是最大的问题:谁在争定义权?

大模型的下半场,不只是谁的能力更强,更是谁来定义下一代AI应该是什么样的。

梁文锋的答案是:开源、高效、记忆力强、跑在自己的芯片上。

姚顺雨和腾讯的答案是:深度融合场景、长上下文、Agent友好。这两个答案并不互斥,但代表了两种不同的路径,一个是从模型出发往应用走,一个是从应用出发往模型走。

4月,只是一个节点。真正的答案,可能需要整个2026年来慢慢揭晓。

但有一件事是确定的,2025年初,元宝接入DeepSeek的那一刻,是中国AI格局的一次重组,大公司第一次公开承认,创业公司在核心技术上跑到了前面。

2026年4月,如果混元和V4同时亮相,将是另一次重组的开始,不再是谁领先的问题,而是各自走哪条路的问题。

中国AI的故事,正在从赛跑变成分道。

而分道,往往比赛跑,更有意思。

【版面之外】的话:

两家公司,两种路径,一个时间点。

真正有意思的,不是分数。是在这两张答卷里,会看到两种完全不同的安全感。

DeepSeek的安全感,来自把东西做出来,开源、高效、跑在自己的芯片上,这套打法能持续。

腾讯的安全感,来自把东西放进去,放进微信里,放进QQ里,放进游戏里。

4 月的交卷,对于腾讯来说,不是为了向外界证明什么,本质上是为了把元宝的大脑,从 DeepSeek 那里赎回来。

简体中文 English