
在具身智能领域低调已久的字节,终于投出了在该赛道的第一笔直接投资。
1月12日,自变量机器人完成了10亿元的A++轮融资,这是一家成立于2023年的具身智能企业,此前,已吸引了美团和阿里的投资。在这轮融资中,罕见的出现了字节跳动。
2025年以来,具身智能赛道热度攀升,互联网大厂纷纷出手,腾讯、京东、美团高调布局,只有字节显得异常低调。
企查查数据显示,字节上一波投资机器人的高峰期是2019-2021年,而在这一轮具身智能热潮中,字节相对克制,特别是在2023年后成立的具身智能公司中,自变量是字节目前唯一一次出手。
这次出手,或许与创始人张一鸣的持续关注有关。
据《晚点 LatePost》报道,2025年,张一鸣拜访了一些早期具身智能创业公司和产业链公司,甚至有投资人评价,在他这个级别的企业家里,很多人已经不会见这么早期的创业者,张一鸣还保有很强的好奇心和想了解新东西的学习意愿。
互联网大厂投资机器人,往往与自身业务战略紧密相关,叫做卡生态位。自变量机器人能够做“最后100米配送”的事儿,从这个意义上来看,美团和阿里投资自变量,不难理解,他们都有配送需求。但是对于字节来说,其背后战略意图又是什么呢?
01
WALL-A模型,自变量机器人
完成最后100米外卖配送
自变量机器人成立于2023年12月,创始人王潜毕业于清华大学,博士期间,王潜曾在美国顶级机器人实验室参与多项机器人学习研究。
但是他并没有继续做机器人事业,而是创立了量化基金公司,这也是王潜很后悔的事,后悔没把机器人事业做下去。
后来王潜在工作中接触到了OpenAI的GPT-3模型,于是决定回国创业,创办了自变量机器人。
该说不说,量化基金和AI是天然适配。做量化基金的梁文锋推出了DeepSeek,同样做量化的王潜,创办了自变量机器人,都投身到了AI相关行业。
从一开始,自变量机器人就聚焦于“通用具身大模型”的技术研发。王潜选择了“端到端统一VLA大模型”的技术路线,这也是当时国内唯一一家从第一天就选择了端到端统一大模型技术的公司。
端到端的VLA(视觉-语言-行动)大模型,是目前行业的主流路径。谷歌Gemini robotics、美国具身智能企业PI、Skild AI,都选择了这条技术路线。
基于此,自变量自研的WALL-A模型,首创VLA与世界模型深度融合的系统范式,可以让双臂机器人完成例如衣物处理、收纳整理、线束整理等多项复杂精细操作。
这一模型技术的可贵之处,在于机器人在部分未见过的新任务场景中展现出了零样本泛化能力,这是实现通用机器人的关键标志之一。
今年3月,接受《智能涌现》采访时,王潜表示,自变量机器人的模型水平基本上和PI、和google在同一个水平线上。而国内厂商普遍才刚起步要往这个方向去做,进度上就会差得比较多了。
也有投资人表示,宇树和智元算第一梯队,融资金额都在15亿元以上,自变量机器人融资金额超过10亿元,已经从二线企业进入准一线之列。
技术上的领先,让自变量获得了资本市场的青睐。企查查信息显示,自变量机器人已累计获得9次融资,融资至A++轮,其中更有2025年5月美团独投的数亿元A轮融资,以及9月份阿里云的参投。

图源:企查查
伴随技术成熟,自变量也完成了从软件到硬件的产品闭环,不仅实现了机械臂、关节模组、动力驱动器等核心零部件全研与算法适配,还相继发布了“量子一号”与“量子二号”两款机器人本体。
2025年8月,自变量发布的全自研轮式双臂仿人形机器人“量子2号(Quanta X2)”,能满足智能仓储(快递分拣)、服务、家庭等复杂场景的需求。

图源:自变量机器人公众号
真正展现其技术实力的,则是自变量不久前公开的一段实拍视频:搭载WALL-A模型的“量子1号”机器人在真实开放环境中,全程自主完成了外卖配送“最后100米”的任务,全程没有人工干预。
自变量宣称,这是全球首个基于VLA端到端模型,在真实开放场景下全程自主外卖配送的移动操作范例。

图源:自变量机器人公众号
其中包含“取件与拆箱回收”、“长距离自主配送”“和乘电梯精准送达”三大环节。涉及不少技术难点,譬如机器人从粘有魔术贴的外卖纸箱中取出餐食,这个过程是对机器人双臂协同与力控能力的考验;机器人将外卖纸箱折叠,塞入狭窄回收口,展现出端到端“力-位”控制技能。
这次演示也让外界看到,自变量的机器人能够在复杂真实环境中实现“用脑思考,用手干活”的潜力,也是一次硬件、技术与场景融合的突破。
02
双线战略浮现,
字节在机器人上的野望
从大厂投资具身智能的普遍逻辑来看,往往与自身业务场景紧密相连。
譬如美团对具身智能的投资,倾向于拓展无人化服务能力。与银河通用合作,双方打造由人形机器人值守运营的24小时“无人”药店。
那么字节投资自变量,背后又是什么逻辑?
这就要从字节的机器人战略来看。
字节在机器人上的布局,很大程度上来自于张一鸣。早在2020年,张一鸣就对机器人表现出兴趣,会不定期参与机器人项目讨论。不过当时,字节的投入还是相对克制。
转折点是2023年。据《晚点 LatePost》报道,2023年中,张一鸣与字节跳动CEO梁汝波等字节高管,和AI Lab机器人团队有一次会议讨论,目的是探讨字节机器人的方向。最终,目标分为两部分:一是生产机器人,服务字节的电商履约需求;二是关注技术,将AI大模型能力用到机器人上。
所谓服务于电商履约,指的是机器人能在仓库里拣货、搬运和打包货物。抖音有自己的电商仓等,使用机器人能够应对在大促期间订单暴增所带来的拣选、搬运等压力。
当时,张一鸣还鼓励团队把目标定得大一点。当年,字节就完成了200台量产。后来,《晚点 LatePost》在2025年7月报道称,字节开发的机器人累计量产超千台,而且是轮式物流机器人。
对于上述消息,字母AI向字节方面求证,对方表示不予回应。
此外,在量产方面,2025年,字节跳动还与赛力斯合作,共同推动人形机器人量产与应用。
除了硬件量产,字节也在推动具身智能技术的进步,特别是2025年以来明显加速。
2025年7月,字节跳动Seed团队推出VLA(视觉—语言—动作模型)模型——Seed GR-3。
Seed是字节在人工智能领域的核心研发团队,成立于2023年,研究方向中就有具身智能领域。自2023年开始,AI Lab团队开始陆续并入Seed。
据Seed团队介绍,GR-3模型能够理解抽象指令、操作柔性物体,并具备良好的泛化能力,能够有效处理长程任务并能进行高灵巧度的操作。
为此,字节还同步开发了通用双臂移动机器人ByteMini,搭载GR-3,形成一套完整的解决方案。

图源:字节官网
12月,Seed团队又进一步发布了GR-RL框架,让机器人在真实场景中稳定完成多步骤、高精度的操作任务。
一边是技术推新,一边是人才储备。
2025年6月,Seed团队就被曝出招聘多个针对机器人产品、工程及具身智能大模型负责人。几个月后,字节跳动旗下火山引擎也启动招聘,例如“操作算法资深专家(具身智能)”,主导人形具身机器人操作算法、VLA模型研发等工作。
可见,在具身智能赛道,字节大致也是两条腿走路,正采取“软硬件结合、自研与投资并举”的策略。
虽然字节在具身智能投资上表现相对保守,不过,和字节渊源颇深的锦秋基金,倒是多次出手。“每日经济新闻”报道,字节跳动是锦秋基金的众多LP之一。2025年,锦秋基金投资了星尘智能、因克斯、宇树科技等具身智能企业。
这就不难理解,字节为什么投资自变量机器人,双方有战略契合点。在软件方面,自变量的端到端的VLA模型WALL-A,拥有多模态思维链与零样本泛化能力;在硬件层面,自变量的量子1号展现出来的智能仓储能力,也是和字节现业务相辅相成的。
正如恒业资本创始合伙人江一表示,自变量的价值远超“最后一公里配送”的表象,而是正在构建物理世界的基础模型,这正是字节看重的战略资产。自变量的端到端VLA技术路线,与字节的大模型基因形成互补。WALL-A模型的多模态思维链能力,可能为字节的AR/VR、智能硬件等业务提供底层支撑。
此外,江一还表示,字节跳动虽不直接做配送,但其电商、本地生活等业务正在加速布局,自变量的柔性操作能力和泛化部署经验,可能成为字节突破线下场景智能化的关键技术跳板。
参考资料:
《自变量机器人王潜:具身智能大模型没法抄国外作业》智能涌现
《这家公司成立两年,获8轮融资,美团、阿里云重仓押注》中国企业家杂志
《字节要造机器人,团队计划扩充到百人》晚点 LatePost
《2年半,字节造出千台机器人,长期目标是具身智能》晚点 LatePost
《自变量获字节、红杉等10亿元投资,构建物理世界的基础模型》自变量机器人

