中国人工智能企业DeepSeek宣布其大语言模型V3.1迎来重大升级。新版本采用了UE8M0数据类型,专门优化以适配即将面世的国产芯片。此次升级整合了“思考型”与“非思考型”模型功能,用户可通过聊天模板轻松切换模式,同时上下文窗口容量从65,536个Token扩展至131,072个。在性能方面,V3.1的非思考模式在多项关键指标上均有显著提升,工具调用能力大幅增强,在Browsecomp测试中更是取得了30分的高分,远超旧版。此外,新版本通过减少思考Token的使用,有效降低了服务成本。DeepSeek还向开发者开放了模型权重,以便他们进行进一步的定制与优化。