DeepSeek V3.1大模型升级，适配国产新芯片，性能显著提升

6 小时前

中国人工智能企业DeepSeek宣布其大语言模型V3.1迎来重大升级。新版本采用了UE8M0数据类型，专门优化以适配即将面世的国产芯片。此次升级整合了“思考型”与“非思考型”模型功能，用户可通过聊天模板轻松切换模式，同时上下文窗口容量从65,536个Token扩展至131,072个。在性能方面，V3.1的非思考模式在多项关键指标上均有显著提升，工具调用能力大幅增强，在Browsecomp测试中更是取得了30分的高分，远超旧版。此外，新版本通过减少思考Token的使用，有效降低了服务成本。DeepSeek还向开发者开放了模型权重，以便他们进行进一步的定制与优化。