11月27日晚,DeepSeek在Hugging Face平台开源了新模型DeepSeek-Math-V2,这是全球首个达到国际奥林匹克数学竞赛(IMO)金牌水平且开源的数学推理模型。该模型基于DeepSeek-V3.2实验基础架构开发,采用自我验证训练框架,在IMO 2025和CMO 2024中均获金牌,Putnam 2024测试中取得118/120分。
简体中文 English