DeepSeek发布Prover-V2模型，参数量达6710亿 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

DeepSeek发布Prover-V2模型，参数量达6710亿

4 天前

DeepSeek于AI开源社区Hugging Face发布了新模型DeepSeek-Prover-V2-671B，参数高达6710亿。该模型采用更高效的safetensors文件格式，支持多种计算精度，便于快速、低资源消耗地训练和部署。据推测，该模型或为去年发布的Prover-V1.5的升级版。在架构上，DeepSeek-Prover-V2-671B使用DeepSeek-V3架构，混合专家（MoE）模式，包含61层Transformer和7168维隐藏层，支持超长上下文，最大位置嵌入达16.38万，并采用FP8量化技术提高推理效率。

上一篇：科大讯飞联合华为发布讯飞星火AIPC

下一篇：微信刷掌正式出海首站落地新加坡

返回列表

热文阅读

2 天前

前ASML研究员帮助中国研发EUV技术，这下轮到美国和荷兰紧张了

2 天前

Intel Panther Lake首发版本曝光！其它等明年

2 天前

苹芯科技 N300 存算一体 NPU，开启端侧 AI 新征程

2 天前

新加坡检方要求延长调查英伟达芯片走私案，或将追加指控