DeepSeek在AI开源社区Hugging Face发布了名为DeepSeek-Prover-V2-671B的新模型,采用高效的safetensors文件格式,支持BF16、FP8、F32等多种计算精度,以提升训练和部署效率并节省资源。该模型参数达6710亿,或为Prover-V1.5的升级版,使用DeepSeek-V3架构,含61层Transformer层,能处理复杂数学证明。