阿里通义千问发布了Qwen3系列模型的技术报告,详述了模型架构、预训练及后训练流程、性能表现等技术细节。Qwen3系列包含8款模型,参数规模从0.6B到235B不等,支持多语言和多模态任务。通过引入混合专家架构和动态推理模式切换等技术,Qwen3在推理能力、指令遵循、多语言支持等方面表现出色。