银河通用超级大脑筑基,中国具身智能站上全球创新潮头
来源:36kr 10 小时前

人工智能的进化,注定不会停留在屏幕之内。

当数字世界的算力红利逐渐逼近边界,AI向物理世界延伸正成为产业发展的下一站。而其中最具代表性的具身智能,也因此被国家视为新的战略高地。

3 月4日两会期间,在回答中外记者关于科技创新的问题时,十四届全国人大四次会议大会发言人娄勤俭提到,人形机器人正成为中国科技创新的重要方向,并表示2025年是国产人形机器人产业实现技术突破与场景落地双重跨越的关键一年。

他同时强调,未来一段时间,中国将进一步加强原始创新和关键核心技术攻关,在“十五五”期间推动科技创新与产业创新深度融合,加快重点领域核心技术突破。

宏观层面的产业定调,很快在资本市场得到回应。

近日,具身智能公司银河通用宣布完成新一轮25亿元融资,投后估值超过200亿元,成为国内具身智能领域估值最高的企业之一。即便是在近年持续升温的具身融资热潮里,25亿也属于极为罕见的数字。

它还意味着一种信号:具身智能的通用大模型底座,已被提升至与芯片同等的战略基础设施高度。

资本的重注,源于银河通用在极端环境下的自证。在马年春晚上,银河通用旗下机器人Galbot抛开了写死的预设程序,自主完成了盘核桃、捡碎玻璃、叠衣服、串烤肠等非标准化操作,所有动作均由“银河星脑”实时决策。

过去几年,人形机器人常常以提前写好脚本的跑跳或机械舞来博取眼球。这一次,重在“自主干活”的机器人在春晚舞台上,证明了自身真正走出了实验室,拥有了面对复杂世界的破局能力。

所以,为什么资本和春晚,同时指向了这家年轻公司?

具身智能的“OpenAI时刻”

剥开25亿元融资的表象,资本持续押注银河通用的逻辑逐渐清晰:就像OpenAI为通用大模型打开技术范式,这家公司也试图在具身智能领域走出一条开创性的路径。

2023年以前,AI技术已经广泛应用于垂直场景,但却始终停留在工具增强的阶段,缺乏一个能够统一多任务能力边界的底层模型。GPT 4.0的推出,为通用人工智能划定了新的技术坐标:大规模预训练模型可以通过统一架构处理语言、代码、逻辑推理等多类型任务。

基于此,如今的机器人行业,正处于百家争鸣时期。

先将视角拉至大洋彼岸——以Figure、Tesla(Optimus)、1X为代表的美国头部梯队,正聚焦于“大脑”的底层算法突破,渴求端到端(End-to-End)的大模型能力与泛化认知。例如,背靠OpenAI的Figure正推进视觉—语言—动作(VLA)模型,希望让机器人理解更复杂的现实语境;特斯拉Optimus则试图复用自动驾驶FSD积累的视觉理解与算力体系,将其迁移到机器人控制与决策之中。

但这些探索目前仍处在早期阶段,在商业化落地和演示真实性上也不断引发争议。例如,Figure目前公开展示的人形机器人操作视频多在实验室环境中完成,而特斯拉Optimus展示的能力也主要集中在叠衣服、搬运物品等基础任务,距离真正进入复杂现实场景仍需要时间验证。

一个重要原因在于,许多机器人系统仍以模仿学习为重要训练入口。也就是通过“行为克隆”,从人类示范数据中学习动作策略。这种方式能够快速获得基础操作能力,但一旦脱离示范数据所覆盖的情境,进入充满随机变量的现实环境,机器人仍容易因为缺乏对物理世界的深层理解而表现失常。

再把视角拉回国内。以舞蹈、对抗和高动态动作为代表的展示型能力,让越来越多人直观感受到人形机器人在动态控制与机械结构上的突破,也让宇树等公司得到了高度关注。这种技术路线当然有其必要性——高动态控制能力,是具身智能走向复杂环境的必要基础。

但这并非机器人的全部。人形机器人的终极目标不仅是完成高难度动作,而是进入真实场景“干活”,这也是机器人行业的当下共识。

银河通用技术路线的宗旨,就是能“干活”。

机器人能够进入千行百业“干活”的前提,是优秀的泛化能力,即理解复杂环境并灵活执行任务。支撑银河通用实现这种能力的基座,是其自主研发的“银河星脑”(AstraBrain)。据企业介绍,它是全球首个集成“大脑-小脑-神经控制”于一模的全身全手端到端具身大模型。

传统机器人往往要“见过才能做”,而涵盖了操作、导航等多个维度的AstraBrain,从底层逻辑上重构了这一范式。其拥有的高维度泛化能力,能让机器人面对未知变量时,具备类似于人类的直觉与常识,从而边思考边执行。

在“双手”的操作层,则在解决业内“对不准、抓空”的通病。针对传统大模型单目视觉容易抓空、极度依赖昂贵真实数据的痛点,银河星脑构筑了操作双基座。

其中,GraspVLA结合海量仿真合成数据,实现了对光照、干扰物的零样本(Zero-shot)真机泛化,其真实抓取成功率显著超越了OpenVLA与Octo等主流大模型。

而StereoVLA更是创造性地引入了立体视觉,精准攻克了透明物体和细小物体的操作盲区,任务成功率显著领先现有工作。

在操作之外,AstraBrain进一步在作为“双脚”的导航层打破了原有的孤岛现象。

过去的导航算法是割裂的,造车的只管车,造狗的只管狗。银河星脑的导航大模型打破了这种“本体隔离”,用统一的框架指挥轮式机器人、四足机器狗、无人机和自动驾驶汽车。更硬核的是,为了让庞大的7B参数基座能在算力受限的真实机器人上实时运行,团队独创了BATS采样策略,像人脑一样自适应保留关键帧,实现了30分钟以上的稳定长程跟随而不爆内存。

这种底层架构的重构,让银河通用的商业化不只停留在脆弱的单点Demo,在工业制造、智慧零售等复杂的真实环境中,也能跑通了运转闭环。沿着OpenAI建立的逻辑,银河通用试图确立的新范式很明确:机器人不该是供人观赏的玩具,而是一种生产力工具。

无论是甩开行业的操作精度,还是跨越本体的导航能力,这颗聪明大脑的高维泛化能力并非凭空诞生。其背后真正的驱动引擎,则是具身智能领域的底层资源——数据基建。

数据基建:具身智能的真正分水岭

过去几年间,机器人行业困在了一个悖论当中:在实验室条件下,机器人表现高度可控;进入真实环境后,却总是遭遇频繁失误。

问题的核心,在于数据规模与数据结构不足以支撑真实世界的复杂性。物理世界中的每一次交互都是多重复杂变量的叠加,因此具身智能对样本复杂度的要求远高于纯数字模型。

在这场全球角逐中,获取高质量数据的能力,正在成为企业能否真正活下去的分水岭。

为了翻越数据这座大山,特斯拉等美国厂商采取了“真机遥操(Teleoperation)”路线:雇佣大量操作员穿戴动捕设备,像玩VR游戏一样远程控制机器人,以人工方式收集真实环境数据。这种硅谷硬核做法虽然数据保真度高,但成本极其高昂。更难办的是,面对物理世界动辄百亿级的长尾边缘场景(Corner Cases),纯靠人工收集的数据量只能呈线性增长,容易触及规模化瓶颈。

想要打破这种“算力+财力”的碾压局面,中国企业必须寻找一种更具工程智慧的破局之路。

银河通用就是其中的典型代表。这家公司不仅构建了全球规模领先的百亿级具身智能数据集,还开创了数据基建“银河星坊”(AstraSynth),在数据这一核心生产要素上形成显著优势。

这种做法的核心逻辑,是“以合成仿真数据为主、真机数据为辅”的虚实融合训练范式。在高精度物理仿真环境中,系统可生成海量多样化场景,让机器人在虚拟世界中遍历各种极端情况,再以极少量真机数据完成实战打磨。

例如在抓取任务中,这套系统能够在一周内生成十亿帧级别的机器人轨迹数据。系统会随机改变物体摆放、光照条件、背景环境以及干扰物,让模型在训练阶段就见过更多可能出现的组合。

基于虚实融合的数据路径,银河通用实现了在少样本(Few-Shot)甚至零样本(Zero-Shot)条件下,对新场景、新物体的泛化能力。据披露,其训练效率比业内头部公司高1000倍,基于该数据集训练的模型成功率达到99%,在全球具身智能企业中处于领先水平。目前,银河通用也是全球范围内鲜少实现从仿真数据训练到泛化抓取商业化全链条闭环的企业。

值得一提的是,在2025年数博会上,银河通用的“高质量合成数据集”成果被国家数据局作为高质量数据集典型案例正式发布,也标志着该路径获得官方层面的认可,成为具身智能领域数据基建的示范样本。

银河通用的技术优势,与创始团队的技术背景密切相关。创始人王鹤毕业于斯坦福大学,师从计算机视觉与几何处理领域专家Leonidas J. Guibas教授,长期从事端到端具身大模型研究。回国后,他创立了中国首个专注于具身智能的学术实验室,十余年的底层技术研究,最终化作了今天银河通用的坚实壁垒。

在大模型的世界里,算力决定爆发力;而在具身智能的淘汰赛中,谁掌握了低成本、可持续生成的数据基础设施,谁才真正拥有护城河。

从技术验证到规模落地

春晚舞台的表演只是一场现实狂欢,不能直接等同于产业化能力。对于具身智能而言,高频、长期、复杂环境下的持续运行能力,才是决定一家机器人公司生死存亡的“入场券”。

春晚光环之下,银河通用也已经率先打通“高质量数据集+端到端大模型+规模化应用”的产业化闭环,在工业、零售、医疗等真实场景中实现深度落地,商业化路径进入了实证阶段。

工业制造被普遍认为是人形机器人的试金石。这一场景对机器人的稳定性、负载能力和安全标准的要求更高,还需要与现有产线深度融合。

银河通用推出的工业重载机器人Galbot S1,恰恰是一把破局的尖刀。

Galbot S1双臂最大负载50公斤,达到工规级标准,可在粉尘、震动、温差变化等复杂工况下持续运行,并支持自主换电系统,满足长时间作业需求,真正填补了具身智能工业级应用空白。在年初举行的北京人工智能创新高地推进会上,Galbot S1还作为重要成果发布,在技术和战略上均具有意义。在今年的春晚舞台上,它更是作为“大国重器”的代表之一震撼亮相。

制造业巨头从不为概念买单,只会为真实的降本增效付账。在宁德时代的电池工厂里,Galbot S1已经无需人工干预,实现全自主作业。一个更具说服力的事实是:银河通用不仅是宁德时代迄今唯一直投的具身智能企业,还是目前唯一一家真正进入其真实产线,实现持续、自主干活的人形机器人公司。

这种“头号客户+核心股东”的双重绑定,意味着银河通用的技术,已经在严苛链条中完成了双向背书。加上德国博世、丰田、北汽、上汽等数千台累计订单,银河通用已实质性地嵌入了全球头部制造体系的核心动脉。

如果说工业制造强调的是强负载与耐久性,那么大众生活场景则更侧重机器人在高频互动与开放环境下的稳定性,对模型的泛化能力与异常处理能力提出了更高的要求。

在垂直行业端,银河通用直接入局监管严苛、容错率低的医疗零售领域。近期,银河通用机器人即时零售仓拿下了全球首个面向人形机器人的药品经营许可证。

在先行实现了对任意材质药品(含易碎、异形、密封包装等)的泛化抓取能力的同时,银河通用搭建了机器人售药系统,集成高精度AI视觉识别与追溯码采集技术,能够实现药品全生命周期数据记录,做到“来源可追、去向可查”。

在此基础上,银河通用还内置了效期预警算法,能够自动识别临期药品并锁定下架,通过“近效期先发”逻辑优化库存流转,从技术层面避免过期药品售卖。

在先行实现了对任意材质药品(含易碎、异形、密封包装等)的泛化抓取能力的同时,银河通用搭建了机器人售药系统,集成高精度AI视觉识别与追溯码采集技术,能够实现药品全生命周期数据记录,做到“来源可追、去向可查”。 

在此基础上,银河通用还内置了效期预警算法,能够自动识别临期药品并锁定下架,通过“近效期先发”逻辑优化库存流转,从技术层面避免过期药品售卖。

透过机器人在货架前精准操作的技术细节,这背后是一笔提升经营效率的账单。

在空间坪效上,仅仅70平方米的门店就能容纳超5000种药品SKU,是传统自助售药机的数十倍;在商业模式上,它满足了夜间购药的巨大需求。

数据显示,在已开通线上医保购药的地区,夜间购药(22点至次日8点)订单占比达20%,其中31-40岁刚需群体占比接近半数;但全国24小时营业药店占比不足10%。

机器人的全天候接管,不仅降低了传统药房“三班倒”的人力成本,还让执业药师从繁琐的拣货中解放,回归高附加值的专业用药指导。

真实数据是最好的证明:目前,以这套解决方案为核心的即时零售仓已在全国数十个城市灰度部署近百家,累计处理订单超30万单。以此为跳板,银河通用的商业版图正进一步向宣武医院等核心院内场景及康养机构延伸。

在消费端,这是一场战略推进。银河通用已在全球部署超过100个“银河太空舱”,在景区、街区、商圈,机器人自主值守为游客、市民服务,这件事的战略意义在于:机器人开始走上了完全无序、高频交互的真实街头,完成了在开放环境下安全性与泛化能力的跨越。

从工业场景到即时零售,银河通用完成了从封闭工业体系到开放消费网络的跨场景验证,成为中国人形机器人规模化商用落地的代表厂商。相比起特斯拉目前主要部署在自有工厂、执行搬运电池等重复性任务的Optimus,银河通用的商业模式超前至少4个月。

拼图至此完整拼成。回过头看银河通用的本轮融资,国家人工智能产业基金(国家大基金三期)、中国石化、中信集团投资控股等多家国资与产业巨头的加入,不仅输送了财务弹药,更直接向其敞开了稀缺的真实场景。在具身智能的下半场,场景资源本身就是一种商业化进程的关键变量。

当大模型在数字世界掀起浪潮,具身智能则试图在物理世界重写生产逻辑。这25亿元的重注,与其说是投向一家创业公司,不如说是投向一个即将到来的物理智能时代。当“聪明脑”长出了“干活手”,一个由物理智能驱动的通用生产力时代已经大幕拉开。

简体中文 English