收购仅一年即“决裂”,创始人贾扬清出走英伟达:黄仁勋不满运营效果,20 亿美金的 AI Infra 突围为何折戟?
来源:36kr 5 小时前

据半导体调研机构 SemiAnalysis 爆料,LeptonAI 的创始人兼 CEO 、英伟达系统软件副总裁贾扬清,已从英伟达离职。距离黄仁勋豪掷 7 亿美元,收购这家仅有 20 人的创业团队,才刚刚过去一年。

更耐人寻味的是,就在本月初,GPU 云服务商 Hyperbolic 宣布聘请贾扬清担任公司顾问。Hyperbolic 在公告中称,贾扬清将为其在 AI 系统、云基础设施、GPU marketplace、多云编排和 GPU 利用率提升等方向提供经验支持。这在业务层,与其在英伟达负责的DGX Lepton平台高度相似。

笔者对此向贾扬清本人求证离职消息,截止发稿前暂无正面回应。目前贾扬清社交平台 x、领英的就职信息仍停留在英伟达阶段。

对于离职原因,SemiAnalysis 直言,DGX Lepton 的运营效果不及黄仁勋预期;但更深层的原因还涉及,黄仁勋与贾扬清在项目开源承诺的分歧、产品落地执行力等层面的问题。

Caffe、PyTorch、ONNX 的缔造者,上一代 AI 框架公认的奠基人。连人带团队 7 亿美金被英伟达收编,原本是一段软硬融合的佳话,为何短短一年就分道扬镳?

细究下来,在这个戏剧性的转折背后,还藏着两个强烈的行业信号:

第一,GPU 可以靠稀缺性卖断货,但 AI Infra 却无法实现垄断。当英伟达作为硬件霸主试图向上层软件扩张时遇到的阻力,比造 GPU 还大

第二,当 AI 已经能自己写代码、管集群,那些以“降低工程门槛”为卖点的中间件平台,正在面临被直接被取代的价值危机

贾扬清交付的筹码 

2025 年 4 月,英伟达正式完成收购,随即将 LeptonAI 更名为 DGX Cloud Lepton,并于当年 6 月重新对外发布。

表面上看,这是一次软件能力的补强。但如果联系英伟达当时的战略处境,就会发现这笔收购的野心远不止于此。加上此前收购的AI 基础设施编排和工作负载管理平台 Run:ai 约 12 亿美元,英伟达先后在 GPU 云软件栈上的总投入将近 20 亿美元。

过去两年,英伟达是 AI 时代最大的“卖铲人”,但这还不够。黄仁勋不仅想让大家买它的卡、用它的 CUDA、接它的软件栈,还希望把全球 GPU 资源变成一个统一入口

简单来说,就是从 AWS、Azure、阿里这些客户手里再分一杯羹:在云厂商之上,再建一层属于自己的软件平台。让开发者不再到处问“哪里还有 H100”,而是直接在英伟达的平台上找卡、租卡、部署模型。

而贾扬清,就是这个计划最完美的代言人。

对华人开发者来说,贾扬清曾一度被视为 AI 领域的大神,并长期推崇践行开源精神。

2013 年,还在 UC Berkeley 读博士的他,写出了 Caffe——第一个被工业界大规模采用的深度学习框架。它奠定了"模型即配置文件"的工程范式,让深度学习第一次真正走出了实验室。

2016 年他加入 Meta,联合微软推出 ONNX,主导 PyTorch 1.0,今天几乎所有主流 AI 模型都跑在 PyTorch 上;三年后,他以技术副总裁的头衔加入阿里,主导大规模 AI 基础设施建设,积攒了生产环境运营 GPU 集群的一手经验

2023 年贾扬清离职创业,与同样来自 Meta AI 的 白俊杰 联合创立 LeptonAI,拿到了 1100 万美元种子轮融资,承载的正是“降低 AI 工程师使用和管理 GPU 集群门槛”的想象力。

三大开源框架、两家顶级大厂、一段中国市场经历——这是贾扬清带给英伟达的筹码。英伟达买下的,也不只是 Lepton 这家创业公司,还有 AI 开源社区对于贾扬清长达十年信任积累。

黄仁勋给出了足够的诚意和价格,贾扬清也带着将 AI Infra 推向新高度的抱负入局。这本该是一场完美的双向奔赴,但遗憾的是,在商业变现与开源信仰的碰撞下,双方最终没能走向共同的愿景。

三道无法弥合的裂缝 

从万众瞩目到创始人出走,仅仅一年。据 SemiAnalysis 拆解,问题主要出在三道裂缝上。

第一道裂缝,是开源信仰的破灭。

英伟达在收购时承诺,Lepton 的核心软件平台将于 2026 年开源。这个承诺,对贾扬清而言绝不是一个可有可无的细节——他的整个职业生涯,都建立在开源精神之上。Caffe 开源,ONNX 开源,PyTorch 开源。他不是一个偶尔拥抱开源的工程师,他是那个用开源重塑了整个 AI 工程基础设施的人

然而这个承诺,至今没有兑现。

SemiAnalysis 的推断是:黄仁勋最终改变了主意,否决了开源计划。 对于一个把开源视为信仰的创始人而言,这不是产品路线的分歧,而是根本性的价值观冲突。

回顾英伟达的开源记录:NIMs 名义开放实则封闭,flashinfer 也从开源社区项目变为闭源 cubin 内核,RIVA 等 ML 平台也走向了类似命运。贾扬清对此不可能没有预判,但他或许仍抱有改变的希望。直到希望落空。

第二道裂缝,是产品执行的跑偏。

SemiAnalysis 的措辞相当直接:"NVIDIA's product management culture did not let Lepton bloom into what it could have become."(英伟达的产品管理文化,没能让 Lepton 开花结果。)

实际情况令人唏嘘:团队的资源被消耗在更换配色方案和登录界面 UI 等表面工作上,而真正的核心技术问题,比如多租户(multi-tenancy)始终没有被解决。某云厂商(合作方)更是直言不讳:"Lepton 解决了 GPU 云的所有问题,除了最难的那个。"

要知道,AI 原生开发者历来不愿为英伟达的非关键路径软件付费。他们信任的是 vLLM、SGLang、SLURM 这些从开源社区里长出来的工具链,而不是某个大公司包装过的 SaaS 平台。

Lepton/DGX Lepton 的目标用户,恰恰是对这类产品最挑剔的一群人。

第三个裂缝,写在股权结构里。

一般来说,标准的收购协议中,创始人股权通常分 3 到 4 年归属。贾扬清仅一年便离职,这也意味着:要么他放弃了大量未归属的股权,要么他在谈判时就争取到了一年内完全归属的特殊条款。

无论哪种情况,都说明他离开的决心极为坚定。这不是一次被动的人事调整,而是一次主动的、彻底的告别。

据早期信息显示,Lepton 平台在 2025 年中期前后已基本停止对外运营。

Agentic Coding 的降维打击 

如果说价值观冲突和产品跑偏是内部问题,那么外部的模型发展和市场走向,则动摇了整个 AI Infra 赛道的价值结构。

LeptonAI 当初试图解决的,是一个真实存在的痛点:降低 AI 工程师使用和管理 GPU 集群的门槛。开发者不想管 Kubernetes,不想写部署脚本,不想折腾推理服务,不想处理扩缩容、监控和日志……这些事情繁琐、专业、耗时。所以,一个把这些复杂性打包起来的运维平台,可以让开发者专注于模型本身。

2023 年,这是一个值得花数亿美元去解决的问题。但到了 2026 年,这个问题的门槛和解法已经松动。

以 Cursor、Claude Code、Codex 为代表的 Agentic Coding 工具正在重塑软件开发的底层逻辑。"Vibe-coding"不再是一个噱头——开发者可以用自然语言描述需求,AI Agent 自动生成、调试、部署完整的基础设施代码。

比如,竞争对手AMD 开源的 Spur 项目,一个与高性能计算调度器 Slurm 完全兼容的开源替代品,可以直接被 AI Agent 调用和配置,几乎零门槛。

这意味着什么?

Lepton 试图用产品化方式解决的问题,正在被 Agentic Coding 用代码生成的方式直接跳过。 当你的平台仅仅是把部署流程包装得更顺滑,把一些常见操作自动化,把 API 封得更漂亮,那么 Agentic Coding 的崛起会削弱它的稀缺性

因为开发者会越来越有能力用开源组件拼出自己的工作流,用 Agent 修配置、写出集群管理脚本、接监控、改 SDK、迁移部署环境。

这不是 Lepton 一家的困境,而是整个"AI 基础设施抽象层"赛道正在面临的系统性挑战。

那些在 2022 年到 2024 年间以"降低 AI 工程门槛"为卖点融资的公司,都需要重新回答一个更尖锐的问题:你到底解决的是表层的复杂性,还是底层的稀缺性?

简体中文 English