梁文峰和姚顺雨，四月交卷

来源：凤凰网 18 小时前

撰文｜画画

2026年4月，中国AI圈将迎来一次罕见的同台竞技。

DeepSeek V4，梁文锋打磨已久的多模态大模型，计划正式上线。

几乎同一时间，腾讯混元新模型也将发布，负责人是姚顺雨，2025年底刚刚回国，顶着腾讯总办首席AI科学家的Title走马上任。

两家公司，一南一北，一个初创，一个巨头。

一个是用量化私募思路颠覆了AI行业的理工男，一个是被腾讯用最高规格从海外请回来的学术派。

他们几乎不可能在同一张牌桌上出现，但4月，他们都要交卷。

这不是巧合，这是一个节点。

1、腾讯的那个决定

要理解4月意味着什么，必须回到2025年初腾讯做的那个决定。

彼时国内大模型市场，百度有文心，阿里有通义，字节有豆包，各家都在跑马圈地。腾讯混元排不进第一梯队，产品端的元宝几乎没有存在感。

就在这个时候，腾讯选择在元宝里接入DeepSeek。

这个决定在当时被很多人解读为务实之举，与其死撑自研，不如先用最好的模型把用户留住。

但它同时也是一个承认：在大模型能力这件事上，我们现在不如一家创业公司。

元宝的数据验证了这个决定的正确性。

接入DeepSeek之后，用户和活跃度明显回升。这是腾讯用流量换了时间，用元宝已有的产品生态和微信QQ的导流能力，换来了姚顺雨团队自研模型的窗口期。

但时间窗口终究有限。一旦混元最新的版本上线，腾讯面临的第一个真实问题是：留在元宝里的用户，到底认的是哪个名字？

这不是能靠市场调研回答的问题，它只能靠4月之后的留存数据来回答。

2、DeepSeek的另一道难题

DeepSeek这边，面对的是一种完全不同性质的压力。

V3发布之后，DeepSeek的数字是这样的：上线至2025年2月9日，累计下载超过1.1亿次，周活跃用户最高接近9700万。

这个量级，已经接近Twitter在鼎盛期的日活水平，对于一个发布不到半年的AI应用，当时几乎没有先例。

更大的影响发生在行业层面。V3发布后，英伟达单日市值蒸发约6000亿美元，美国科技圈开始重新讨论算力军备竞赛的逻辑是否成立。

DeepSeek用一个开源模型，在成本和效率上同时挑战了大模型必须靠暴力堆算力的行业共识。

但这组数字和这段叙事，也同时变成了V4必须背负的重量。

市场对V4的预期，不是比V3更好，而是能不能再次重新定义。这是一个很难完成的任务，因为V3已经把天花板拉得很高。

梁文锋选择的应对方式，是让V4的迭代方向足够具体，而不是继续打效率革命的旗号。

从论文节奏看，这个准备早就开始了。

2025年12月，署名包含梁文锋团队的《mHC: Manifold-Constrained Hyper-Connections》发表，方向是底层架构的连接方式优化；

2026年1月，梁文锋署名的《Conditional Memory via Scalable Lookup》提出条件记忆机制，在推理过程中，模型可以根据条件动态检索和激活相关记忆，而不是把所有历史上下文都塞进一个固定窗口里。

这两篇论文，距离V4发布只有几个月。它们不是学术展示，更像是产品路线图的技术背书。

V4还有一条线被单独提出，深度适配国产芯片，并有望成为首个完全运行在国产算力生态上的顶级大模型。

在此之前，所有顶级大模型的训练和推理都高度依赖英伟达的GPU。华为昇腾、寒武纪等国产芯片在性能和软件生态上与英伟达仍有差距，适配工作远比听起来复杂。

如果V4真的跑通了，意味着中国大模型产业链上最关键的一环，算力依赖第一次出现了可被验证的替代路径。

3、两条路，同一个终点

有意思的是，DeepSeek和腾讯在技术路线上正在往同一个方向收拢：长上下文、长期记忆、Agent可用性。

这不是巧合，这是整个行业正在形成的共识。下一代AI竞争的核心，不再是谁的参数更多，而是谁能真正记住用户、理解上下文、在复杂任务中持续工作。

但两家公司走向这个终点的路径截然不同。

DeepSeek的做法是从底层架构动刀，条件记忆机制是要在模型本身的记忆方式上做根本性改变。

腾讯的做法是先定义评测标准，CL-bench提出了一套衡量上下文学习能力的新基准。

如果这套标准被学术圈和行业接受，腾讯就获得了一个叙事上的主动权：你的模型好不好，要按我定的标准。

两种路径，代表了两种不同的竞争策略。做出更好的产品，和定义什么叫更好的产品，是两件事。

历史上，后者有时候比前者活得更久。但前提是，你定的标准得被别人接受。如果DeepSeek V4的能力直接碾压了CL-bench设定的评测维度，那套标准就只是腾讯的自我评分。

4、四月之后

4月会到来，两张考卷会被打开，市场会给出它的判断。

但真正值得追问的问题，比谁的模型更好要复杂得多。

第一个问题：腾讯能不能接住用户的切换？

从接入DeepSeek到推出自研混元，这条路如果走通，腾讯的体量、数据、场景接入，微信、QQ、腾讯视频、游戏、企业微信，一旦有了够用的底座，这些场景的价值才能被真正释放出来。

但如果切换之后用户留存下滑，腾讯可能需要重新评估自己在这场竞争里的位置。

第二个问题：DeepSeek能不能守住国产第一的位置？

V3之后，DeepSeek已经不只是一个产品，它是一个标准、一种叙事。

V4需要证明，这不是偶然，而是一种可持续的能力。

尤其是在国产芯片这条线上，如果跑通了，DeepSeek将拥有一个其他顶级大模型都没有的叙事，而这个叙事的价值，可能比模型本身还要大。

第三个问题，也是最大的问题：谁在争定义权？

大模型的下半场，不只是谁的能力更强，更是谁来定义下一代AI应该是什么样的。

梁文锋的答案是：开源、高效、记忆力强、跑在自己的芯片上。

姚顺雨和腾讯的答案是：深度融合场景、长上下文、Agent友好。这两个答案并不互斥，但代表了两种不同的路径，一个是从模型出发往应用走，一个是从应用出发往模型走。

4月，只是一个节点。真正的答案，可能需要整个2026年来慢慢揭晓。

但有一件事是确定的，2025年初，元宝接入DeepSeek的那一刻，是中国AI格局的一次重组，大公司第一次公开承认，创业公司在核心技术上跑到了前面。

2026年4月，如果混元和V4同时亮相，将是另一次重组的开始，不再是谁领先的问题，而是各自走哪条路的问题。

中国AI的故事，正在从赛跑变成分道。

而分道，往往比赛跑，更有意思。

【版面之外】的话：

两家公司，两种路径，一个时间点。

真正有意思的，不是分数。是在这两张答卷里，会看到两种完全不同的安全感。

DeepSeek的安全感，来自把东西做出来，开源、高效、跑在自己的芯片上，这套打法能持续。

腾讯的安全感，来自把东西放进去，放进微信里，放进QQ里，放进游戏里。

4 月的交卷，对于腾讯来说，不是为了向外界证明什么，本质上是为了把元宝的大脑，从 DeepSeek 那里赎回来。

相关新闻