阿里千问霸榜空间智能榜单前二,性能超越Gemini3、GPT5.1
2025-11-26

11月26日,空间推理基准测试SpatialBench公布最新榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列前二,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。SpatialBench聚焦多模态模型在空间、结构、路径等方面的推理能力,是衡量“具身智能”进展的新兴标准。Qwen3-VL-235B和Qwen2.5-VL-72B分别获得13.5分和12.9分,领先于Gemini 3.0 Pro Preview(9.6分)、GPT-5.1(7.5分)等模型。Qwen3-VL在视觉感知和多模态推理方面取得突破,支持“带图推理”和“视觉编程”,并增强了3D检测能力,可助力机器人实现精准抓取。目前,Qwen3-VL已开源多个版本,包括2B、4B、8B、32B等密集模型及MoE模型,且已上线千问APP供用户免费体验。

简体中文 English