DeepSeek在AI开源社区Hugging Face平台上发布了最新数学定理证明专用模型DeepSeek-Prover-V2-671B。该模型基于DeepSeek-V3架构,参数量高达6710亿,采用混合专家(MoE)设计,拥有61层Transformer和7168维隐藏层,支持多种计算精度,最大上下文长度可达163,840个token。DeepSeek-Prover-V2-671B专注于形式化数学证明,较之前的V1.5版本在规模上有了大幅提升,有望在数学证明基准测试中取得更优异的表现。然而,目前DeepSeek官方尚未公布更多关于该模型的技术细节和性能数据。