李想:辅助驾驶目前是黎明前的黑暗
13 小时前 / 阅读约9分钟
来源:36kr
理想汽车All in AI转型,推VLA模型及纯电i8。

5个月前,作为中国新势力中首家实现盈利的车企,理想汽车CEO李想高调宣布了将All in AI,表示理想要从智能汽车公司,转为AI科技公司。

2025年初,理想汽车完成了一次人事架构变动,由理想汽车总裁、总工程师马东辉担任智能汽车战略负责人,李想则专注于AI方向发展。

彼时,市场曾猜测李想是否不再负责汽车业务。但在2024年财报业绩会上,他表示自己仍是CEO,管理汽车业务相关的产品线、产品部、品牌、战略等团队,只不过对BLM(业务领导力模型)和DSTE(战略开发到执行过程)的负责人做了新的分工,仍将通过全公司的协同方式来实现战略目标。

2024年12月,在《理想AI Talk》第一季中,李想对于人工智能侃侃而谈。市场从中看到了李想的决心,也了解到了理想汽车究竟要做怎样的AI产品。

但随后的130天里,DeepSeek的突然崛起让行业发生了翻天覆地的变化。极氪、零跑等车企开始主动寻求与DeepSeek合作。

5月7日晚,《理想AI Talk》第二季上线,李想也带着全新的VLA(视觉语言行动模型)走到了公众面前。VLA是理想汽车在辅助驾驶领域“端到端+VLM”双系统架构上进化而来的新架构,也凝结着理想对于AI不断加深的思考。

李想表示:辅助驾驶正处于“黎明前的黑暗”。理想汽车要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭。

01、从DeepSeek学到,先做研究再做研发

今年年初,强调“深度思考”与“任务解决”能力的DeepSeek-R1的出现,将大模型带到了全新的发展阶段,也让理想汽车重新梳理了研发节奏。

在此之前,理想汽车的编译团队已经在芯片上操作FP8(8 位浮点数格式)的工程优化。按照原有计划,到今年9月,理想会完成一个高性能的语言模型,作为后续训练VLA的基础。

DeepSeek的出现,让理想内部开始重新评估当前进展是否过于落后。他们发现,DeepSeek V3+R1的性能已经超过了自己9月即将推出的模型,并且DeepSeek开源得非常彻底。

这也让李想考虑,为何不站在“巨人”的肩膀上,直接基于DeepSeek的成果来构建VLA 中的Language(语言)部分。

李想回忆道,起初他担心内部模型团队的感受。但他与理想CTO谢炎和基座模型负责人陈伟沟通后,他们都非常支持这一决策,认为拥抱DeepSeek将大大加速理想的研发节奏。

为此,理想专门成立了一个人工智能战略小组,以DeepSeek为基础,加速VLA和端到端的多模态的进展,并研究如何在芯片上跑出同样的训练和推理效率。

李想直言,从DeepSeek身上,自己学到了非常重要的一点:DeepSeek极简地运用了“人类的最佳实践”来构建强大的AI模型。比如在DeepSeek V3中,它采用了MoE(混合专家模型)架构,参数规模达到 671B。这个架构的核心是:把多个“专家”组合在一起,每个部分专注一个特定能力,从而整体提升模型的表现力。

这背后体现了一个清晰的方法论:先做研究,再做研发,然后是能力表达,最终将能力转化为实际业务中的价值。

李想坦言,这恰恰是企业很容易忽略的过程。企业常常看到目标,便直接启动研发,而忘了第一步的研究。为此,理想在推进端到端、VLM(视觉语言模型)、VLA的过程中,都在效仿从DeepSeek学到的方法论。

而之所以要在当下All in AI,也源于此刻或正是AI引爆的新生产力革命的前夜。虽然有人质疑,AI看似取代了部分人类的工作,但在许多场景中人类工作并未减轻,反而加重了。而在李想看来,人工智能目前还是辅助工具,只有变成了生产工具,才是真正人工智能爆发的时刻。

“只要人类会雇用司机,人工智能技术就是把类似这样的一些功能和角色,去变成真正的生产力、生产工具,然后去进行替代。”

而理想汽车目前研发的“VLA视觉-语言-行为”大模型,正是要打造一个“司机大模型”,像人类司机一样去感知、理解和决策。

李想将“司机大模型”的发展比作从动物到人类进化的三个阶段。“第一个阶段像昆虫式智能,比如蚂蚁依靠预设规则完成任务。第二个阶段是端到端模型,更像哺乳动物的智能,比如马戏团里的动物,模仿人类行为来完成任务。第三个阶段则是VLA司机大模型,它的能力就接近于人类司机了。”

02、AI将成新车亮点

All in AI后,除了李想本人迅速变成了AI专家,理想汽车也完成了在辅助驾驶领域,身位的不断追赶。

一方面,基于理想自研基座大模型Mind GPT的“理想同学”已经从车机进入手机,从智舱智能助理转变为通用智能助手,App也于去年12月27日全量上线。

另一方面,在辅助驾驶领域,理想一直被诟病是落后者,尤其与竞争对手鸿蒙智行相比,产品体验处于下风。经过一年多的努力,如今理想汽车的辅助驾驶技术已跻身行业第一梯队。

这背后是理想汽车模型版本的不断迭代。自2024年7月底推出端到端辅助驾驶内测版以来,理想以每周更新两个模型版本的频率,提升综合MPI(在人类驾驶员需要介入系统前,辅助驾驶系统能够自主驾驶的平均里程数)。

到2024年10月23日,理想推送了“端到端+VLM”功能,首次实现了一体化端到端模型的大规模实践应用,并将大模型部署至车端量产芯片上——这也标志着理想辅助驾驶正式进入了AI大模型时代。

但“端到端+VLM”双系统架构的能力,被李想自嘲为还是“猴子开车”——还是需要人类辅助决策,虽然能力提升了,但还无法达到人类顶级职业司机的水平。

而进一步提高模型能力,投入必不可少。拥抱了DeepSeek后,理想汽车把基座模型的团队拆分了出去。此前理想一年100亿元的研发投入,已有接近一半投在了人工智能。李想透露,在训练硬件方面,理想购买的训练卡数量已达到了预期的3倍。

目前理想训练的模型主要有两个版本,一个是给“理想同学”用的,是一个约3000亿参数(300B)的大模型;另外一个版本是用于辅助驾驶的VLA,其中VL(视觉+语言)部分是一个320亿参数(32B)的模型。

而理想的VLA即将在7月,与纯电产品理想i8同时发布。理想i8定位在30万~40万元区间,主打三排座纯电SUV,也将成为理想在这一价格区间的首款纯电产品。

▲理想i8。来源/理想官方

不过尽管i8还未上市,它的竞争对手已经数不清了。最近亮相/上市的乐道L90、问界M8、小鹏G9等车型,都将与i8共同角逐市场。对于理想汽车而言,纯电i8不容有失,而AI能力将是一大亮点。

除了理想i8,理想i6也将在下半年发布。李想曾透露,i8与i6的上市节奏和2022年理想L9和理想L8的发布节奏相似。这样的好处是,新车型能够在下半年获得较好销量表现的同时,也为下一年第一季度储备更多的订单。

但要实现预期效果,前提在于理想i8能够像理想L9一样迅速打开市场。

2022年6月理想L9发布后,在首个完整交付月就实现了超过1万台的交付成绩。李想表示,即便3年过去,仍然可以看到至少有5家以上的企业,在打造跟理想L9相同的产品。

要缔造下一个L8和L9,理想需要找到新的“杀手锏”,而VLA便是李想锚定的秘密武器之一。

为此,理想汽车已启动了下一代VLA模型的研发。尽管目前有了DeepSeek的加持,但理想汽车还在自研基座模型。

李想解释道,在VLA中,视觉(V)和语言(L)都有特殊要求,视觉部分需要支持3D和高清2D的理解,训练数据需要涉及大量汽车产品以及交通领域的专业语义语料,还有面向家庭用户的语义内容。无论是OpenAI还是DeepSeek,都没有这样的数据、场景和需求,也解决不了这样的问题。

VLA能否成为解决辅助驾驶的终极架构?李想表示,VLA能够实现全自动驾驶,是不是效率最高的方式,还要打个问号。大概率未来还会出现更高效的新架构。毕竟VLA还是基于Transformer(深度学习模型架构),而Transformer是否就是最优的结构,目前还不确定。

李想坦言,DeepSeek没走过这条路,OpenAI、谷歌、Waymo也没有走过,理想汽车要走入的是一个无人区。