“一家大厂,去年雇了几十位年薪三百万以上的应届博士生,顶尖的按照五六百万来抢,比当年华为天才少年还夸张。”
AI人才招聘平台TTC创始人肖玛峰告诉铅笔道,大厂HR蹲守在几所顶尖高校,为AI项目批量抢年轻人。
而Meta为挖OpenAI的研究员,开了一亿美元签字费,工资另算。
前不久,Qwen技术负责人林俊旸从阿里离职,媒体对此事的关注,就像每年8月下旬,大报体育头版对球星转会不停歇的报道。
今天,顶尖的AI研究员,正像顶级球星一样被争抢、被关注。科学家成为流量明星,这是第一次。他们也收获了远超前辈们财富。
01 27亿美元挖人
2024年8月,谷歌花了27亿美元,收购了一家聊天机器人公司Character.AI。
而这家公司估值大概10亿美元。
谷歌愿意支付溢价,根本不是因为这家公司有什么超级专利,而是为了买两个人。
公司创始人Noam Shazeer和Daniel De Freitas。
谷歌的收购条件,就是让他俩马上收拾东西,回谷歌干活。
尤其是Shazeer,他是大模型发展之路上绕不开人物。
2017年,他作为核心参与者,写了那篇著名论文《Attention Is All You Need》。这篇论文干了一件事:提出了一种全新的模型结构(Transformer)。
今天几乎所有你听过的大模型:GPT、Gemini、Claude都是基于这套结构。
2021年,他带着一肚子气离开谷歌,创办Character.AI。原因是谷歌担心风险,不让他发布聊天机器人Meena。
三年后,谷歌买他回来,成为谷歌DeepMind的三位核心领导者之一,领导开发新一代Gemini模型。
明显可以看到,他回去之后,从2025年Gemini 2.5 Pro开始,谷歌的模型硬刚GPT起来,毫不逊色。
并不是说,这都是Shazeer一个人的功劳。而是想说,今天做AI大模型,一个学术灵魂,很可能会拉高它的上限。这个道理,经常看球的朋友,应该很好理解。
02 增加胜率
“你不能把林俊旸这些人,看成传统工程师,可能他们一个回车下去,成或者不成,几千万就出去了。”
Hugging Face中国区负责人、资深工程师王铁震告诉铅笔道,顶级AI研究员的价值,不在执行,而在决策。
训练一个大模型,从选模型(A还是B)、定架构、选数据开始,每一步都要烧钱,动辄就是几千万投入。决策往往就是某一个人拍板,做对了,模型出来;做错了,钱可能直接打水漂。
“大多数工程师,只训练过小模型,没接触过超大规模训练,没有完整从0到1的经验。而顶级人才,知道怎么调用数据,真正跑通过大模型训练,做过RL(强化学习)、对齐、推理模型,才知道一条路线能不能走通,这种经验是见过才有的。”
除了经验,对技术的敏感度也是少数人的专属。王铁震解释:“如果一个人对未来没有清晰的判断,他的决策就会受限。很多关键信号摆在面前,他也未必能抓住。比如当年Dario Amodei在百度时,就注意到智能涌现和Scaling Law。这个东西后来公开发表了,但问题在于其他人没有那种敏感,不知道说这个东西代表了什么。知道这个价值的,就能找到足够的资源,去把这个预判实现。”
要知道,与过去的互联网相比,AI是重资产投入的硬科技领域,买GPU、买算力的钱,车载斗量。Meta据估计有60万张英伟达GPU,微软有30万至50万张,谷歌也有数十万张。这几大巨头,一年在这上面的资本开支是300亿美元起步。行业估计,GPT-4级别模型,单次训练成本就要数亿美元。
这种“重器”,你交给谁才放心?一个钱学森,抵得上五个师,就是这个意思。给顶级AI研究员的工资再多,跟买卡、买云算力比起来,都是小钱。
为什么在传统互联网时代,不会像今天这样,一家公司如此依靠几位明星?王铁震解释,互联网产品本质上靠工程体系和用户规模取胜,可以边跑用户数据边调整产品,大模型在训练“就跟做核弹一样,没有无限的experiment,就那么多机器,有限次尝试机会下,你一定要找到你最能相信的人。”
肖玛峰当年为房地产做猎头时,也见过类似情况。“一些房企老板动不动两三千万年薪(挖负责人),而且是现金,大家觉得,怎么这么夸张?但对他们来说,人不是最大成本。最大的成本是资金,一个项目进去就是上百亿,这么大的投入,对胜率的要求很高,所以找对人很重要。”

《点球成金》剧照
大模型的残酷竞争中,押注明星研究员,也是押注胜率。
03 明星效应
“林俊旸这样的人,是建队的起点。买硬件、GPU需要多少钱?所有的投资都是要回报的,就是有后面的人买单。一个下重注投入的项目,沉没成本非常高,未来的投入也很不确定,有明星在,后面进来花高价买单的更愿意出钱。技术上,已经有了可复制的经验。”
一位大厂技术负责人告诉铅笔道,明星研究员的经验,相当于为企业背书。
有一则传闻。某硬件厂商A,从一家知名大模型公司挖了一位大模型专家。正好A厂在融资,专家加盟后,融资变得很顺利,不久便官宣了数千万元新一轮融资。不过,这位专家待的时间很短,随后去了另一家巨头企业。虽然无法证实,A厂挖来专家是为了融资。但对A厂来说,专家在厂期间,确实从投资人那里以最快速度换来了真金白银。
“行业老手=估值背书”,这样的在其他行业,同样如此。《财经》杂志在一篇报道里说,有大疆离职员工创业项目三个月里估值涨了三倍;大疆一些业务负责人,只要确定离职创业,还没确定具体方向,就能立刻拿到两千万的融资。
除了提升估值,顶级AI研究员的“明星效应”,正在成为公司最重要的品牌资产之一。
王铁震举了个例子,过去,中国科技产品常被视为低价平替,而在AI领域,由于中国的开源模型在全球开源圈“霸榜”,本土研究员成为全球技术话语的一部分,在2025年NeurIPS大会,林俊旸发表了演讲。
“这些人的论文都摆出来的,全世界的同行都能看到、能记住名字。如果一家公司,想拓展全球业务,就带着像林俊旸这种人,去找各个企业里做 AI 研究的高管刷脸就好,很多人实际上是非常想跟他们交流的。本土研究员输出对世界的影响,这是you never see before的。”
在这种情况下,研究员和企业的关系也被重新审视。
人过来,不光是为了挣钱,还有理想。AI顶级人才,靠工资、甚至互联网时代很诱人的期权,也未必能请来的。算力,成为最新的筹码。正如林俊旸离职后,公司内部也出现过对算力资源分配的讨论。
据铅笔道了解,北方一家大厂,创始人亲自出马,谈一位AI明星研究员,钱当然不会少,他开出的另一重磅条件是,承诺一定的算力资源是归其调动。
AI时代,给股票不够了,还要token才行。

