银河通用携手北京智源人工智能研究院、北京大学及香港大学,发布了GraspVLA模型,这是全球首个全面泛化的端到端具身抓取基础大模型,集感知、学习和环境交互能力于一体。该模型采用预训练和后训练架构,其中预训练基于十亿帧数据,使模型能够进行零样本测试并展现出高泛化性。官方还公布了七大泛化“金标准”,包括光照泛化、背景泛化、平面位置泛化、空间高度泛化、动作策略泛化、动态干扰泛化和物体类别泛化,确保了模型在多变环境中的卓越表现。