消息称 DeepSeek V4 模型打破惯例:华为等国内厂商可早期访问,不让英伟达 AMD 先用
来源:IT之家 22 小时前
感谢IT之家网友 Coje_He、软媒用户1238620、会弹琴的九号 的线索投递!

IT之家 2 月 27 日消息,据路透社 2 月 26 日报道,两位了解情况的消息人士表示,DeepSeek 在即将进行重大模型更新之前,未向美国芯片制造商展示其即将推出的旗舰模型,这打破了行业标准做法。

相反,DeepSeek V4 向国内供应商 —— 包括华为技术有限公司 —— 提供了早期访问权限。

报道提到,AI 开发者通常会将主要模型的预发布版本分享给英伟达和 AMD 等芯片制造商,以确保其软件在广泛使用的硬件上高效运行。DeepSeek 之前曾与英伟达的技术人员密切合作。

对于其即将推出的模型,DeepSeek 没有向英伟达和 AMD 提供访问权限,而是给予包括华为在内的中国厂商几周的时间来适配其芯片

英伟达和 AMD 拒绝评论。DeepSeek 和华为没有回应评论请求。

消息源 @legit_api 于 2 月 26 日在 X 平台发布推文,报道称 DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100 万 tokens,并是原生支持多模态推理。

IT之家注意到,本月早些时候,DeepSeek 更新之后开始灰度测试最高 1M(百万)Token 的上下文长度与此同时,最新 DeepSeek 的知识库已经更新到 2025 年 5 月,非联网状态下可准确输出 2025 年 4 月的新闻。

简体中文 English