阿里千问霸榜空间智能榜单前二，性能超越Gemini3、GPT5.1

2025-11-26

11月26日，空间推理基准测试SpatialBench公布最新榜单，阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列前二，超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。SpatialBench聚焦多模态模型在空间、结构、路径等方面的推理能力，是衡量“具身智能”进展的新兴标准。Qwen3-VL-235B和Qwen2.5-VL-72B分别获得13.5分和12.9分，领先于Gemini 3.0 Pro Preview（9.6分）、GPT-5.1（7.5分）等模型。Qwen3-VL在视觉感知和多模态推理方面取得突破，支持“带图推理”和“视觉编程”，并增强了3D检测能力，可助力机器人实现精准抓取。目前，Qwen3-VL已开源多个版本，包括2B、4B、8B、32B等密集模型及MoE模型，且已上线千问APP供用户免费体验。