谷歌发布面向消费级 GPU 的 Gemma 3 QAT 模型
2 周前

谷歌近日发布了Gemma 3系列的优化版,采用量化感知训练技术和4位整数精度,使其能在消费级GPU上运行。这一改进使复杂模型不再局限于高端数据中心加速器,谷歌此前曾承诺减少模型大小和计算要求,现已通过QAT版本实现。