阿里国际AI团队近日发布多模态大模型Ovis2.5,在通用多模态基准、复杂图表理解与OCR等场景展现出领先的理解与推理能力。Ovis2.5能看图求解函数题、分析物流单和发票,还能根据风景照推测拍摄地点。在主流多模态评测套件OpenCompass上,Ovis2.5-9B和Ovis2.5-2B分别取得78.3和73.9的高分,位居前茅。其创新在于引入原生分辨率视觉感知技术和可选的"思考模式",实现性能与效率的双重突破。
沪ICP备2022008883号-2