靠电商和云计算席卷全球的亚马逊,正在借这一波Gen AI浪潮,续写新的故事——
过去,它的AI战略定位是做基础平台,用户可以通过Amazon Bedrock获得全栈式服务。
但大家可能不知道,去年9月,它在旧金山成立了自己的AI实验室,Amazon AGI SF Lab(以下简称亚马逊AGI实验室)。
这标志着亚马逊的重大转型:从基础设施,转向更具雄心的AGI研发。
而且,这个实验室的一号位还是名华人。
大佬叫David Luan,已有15年的AI相关工作经验。他是OpenAI的早期员工,曾做到工程副总裁,参与过GPT-2、GPT-3、CLIP和DALL·E等多个重要项目的研发。
论资历,Luan绝对算市场中的老炮。
实验室怎么来的?
亚马逊之所以决定成立一家AGI实验室,主要是受AGI时代这柄双刃剑影响。
一方面,如果Agent成了新的交互形态,人们不再亲自上网购物,那亚马逊依托于电商生态的广告和佣金业务,显然岌岌可危。
但硬币的另一面是机会。
作为数字化的鼻祖,亚马逊掌握着海量且极具价值的用户行为数据:用户的浏览路径、他们对促销、评论和页面布局的敏感度,以及不同群体之间的相似性。
如果能把这座数据金矿挖掘到位,亚马逊完全有能力打造一个真正实用的模型,摘下那颗低垂的Agent果实。
正是在这样的背景下,2024年6月,亚马逊反向收购雇佣了Adept AI。
△
“反向收购雇佣”指大科技公司不实际收购热门AI初创公司,而是争取初创公司的技术授权,吸纳其核心团队加入,但初创公司本身仍作为独立个体存在。
这桩收购无疑是个大事件。
收购完成后,亚马逊当即将重任交到时任Adept AI CEO的David Luan手中,并以他为首成立了亚马逊AGI实验室。
量子位一通深挖,发现这个实验室真的是高手云集——
首先,实验室的一号位,华人David Luan,毕业于耶鲁大学应用数学与政治科学专业。
6岁时,Luan跟随家人从中国搬到了美国。
从小,他就对计算机抱有浓厚兴趣,并且行动力惊人。
8岁起,Luan就开始在伍斯特州立大学修读夜校项目,5年苦读后,终于拿到了学校颁发的计算机科学证书。
而且Luan的AI职业起点相当早:2011年,Luan就创办了一家深度学习公司,专注于视频分类技术。
这项成果后来被奥巴马政府用于改进执法记录仪。
此后,为了追逐AI最前沿,Luan开始在多家知名AI企业之间辗转。
2018年,他加入OpenAI。
当时,OpenAI团队规模还不到四十人。不久,他升任工程副总裁,他的任务不是写论文,而是将GPT-2、GPT-3等研究成果变成工程产品。
△
2020年,Luan转至Google Brain,担任大语言模型项目的总技术负责人,聚焦于融合研究与工程的大型项目。
但1年后,他就离开了谷歌。
原因是他认为谷歌很多精力都分配在了广告和搜索相关的业务上,很难从零开始开展新的研究路线。
而且大公司组织架构分散,难以集中发力。
当时在谷歌,每个人有限定的资源credit,要跑一个庞大训练任务,你得说服19、20个同事把这些资源让给你。
离开谷歌后,他开始凭借自身专业的AI知识为公司提供咨询服务。
直到2022年,他才再次出山,和两位Transformer作者(Ashish Vaswani和Niki Parmar)联合成立了Adept AI。
再后来,就是加盟亚马逊了。
从上述经历不难看出,Luan的实战经验可谓相当厚实。
聊完Luan,我们再来看看亚马逊AGI实验室的其他人——
亚马逊AGI实验室的二把手是加州大学伯克利分校教授Pieter Abbeel。
Abbeel是强化学习和机器人学领域的专家,带领团队在Deep Q-Learning、模仿学习、自我博弈等方向上都做出过奠基性贡献。
谷歌学术显示,他的论文被引量超过了21万。
加入亚马逊之前,他是一家专注于仓储和物流场景下的机器人拣货初创公司(Covariant.ai)的联合创始人。
这个场景,正好击中了亚马逊的业务核心。
2024年8月,也就是Adept被收购不久后,亚马逊同样通过“反向收购雇佣”的方式,将Covariant纳入麾下,Abbeel随之以研究员身份正式加入亚马逊AGI实验室。
此外,当时跟着Luan一起搬家到亚马逊的,还有四名Adept AI的联合创始人。
第一位是Erich Elsen。
Erich在斯坦福机械工程系拿下博士学位,是GPU计算的专家。
他曾在DeepMind担任资深研究员,参与撰写了包括多篇高被引论文,代表作包括Chinchilla定律、稀疏矩阵GPU内核。
加入亚马逊AGI实验室后,Erich负责多模态代理和强化学习基础设施。
负责产品的是Kelsey Szot。
她拥有斯坦福数理与管科双学位背景,曾在麦肯锡做咨询顾问、在谷歌负责大型模型生产基础设施。
2022年,她联合创立Adept AI,主导了ACT-1与Fuyu-8B等模型的产品化。
最后还有Maxwell Nye和Augustus Odena这对好哥们(他俩就连在简历里也不忘提对方的名字)。
△
这对黄金搭档曾在谷歌共事,参与提出了Scratchpad,这一方法如今被视为现代AI推理系统的基石。
不过,他俩在加入亚马逊不久后便选择离开了。
两次反向收购雇佣、大量招揽顶尖人才……可以说,为了组建这个AGI实验室,亚马逊下了不少力气。
让David Luan当一号位,凭什么?
亚马逊AGI实验室人才济济,David Luan到底有怎样的过人之处,才成为了亚马逊这支秘密队伍的领头羊?
之前我们已经提到,Luan自2011年便开始创业,除了先后加入微软、OpenAI、Google外,他还是一位连续创业者。
但要知道,Luan的优势不仅体现在专业能力,还在于他的战略眼光。
早在2022年——ChatGPT问世之前,入局AI创业的Luan就有一套自己的想法:想办法让AI干活。
我们创办Adept AI时,就发现大模型真挺擅长说话的,但没什么行动力。
因此,他将目光投向了Agentic AI,并成立了当时的第一家Agent公司——Adept AI。
2022年9月,Adept AI发布了首个Agent模型,ACT-1。
这个模型能够通过自然语言指令执行屏幕任务,如在浏览器中导航、填写表格和操作软件。
当然,在今天看来这些能力好像已经并不新鲜。
但朋友们啊,ACT-1是三年前的产物!别说如今爆火的Agent了,就连ChatGPT都还没影子呢。
Luan认为,计算机应该去适应人类,而不是让人类去适应计算机。
因此,Adept也一直采取着这种以人为中心的方法论。
成立不到一年,Adept AI便完成了超4亿美元的融资,一举成为当年融资最成功的AI初创公司之一。
加入亚马逊,给AI搭“健身房”
说起来,Adept干得风生水起,核心团队为啥后来要接受被并?
主要有两点原因:
首先,亚马逊坐拥全球最顶尖的算力基础设施之一,这是小公司无论如何都难以企及的。而对于AI行业来说,算力正是决定模型进步快慢的发动机。
因此,想要前往智能的前沿,必须搭乘拥有发动机够猛的“跑车”。
其次,亚马逊还能提供稀缺的真实数据。
经过这么多年的挖掘,互联网上的高质量数据已经快要枯竭了,大模型发展因此开始减速。
事到如今,人类在日常工作中的实际操作数据成为了高质量的稀缺训练数据。
AI大神Andrej Karpathy对此曾做过一个类比:
想象你要训练一个打网球的智能体,你肯定不能让它99%的时间都在看YouTube网球视频,只用1%的时间真正上场打球。
在Luan看来,亚马逊业务范围极广,“几乎每个500强企业在现实里开展的核心业务,都能在亚马逊内部找到类似的事情”。
这些能产生大量真实数据的内部环境,是Agent的最佳训练场所。
还有一个最关键的原因,那就是Luan不甘心只是做一个提供AI销售服务的小公司。
在我的整个职业生涯中,我只想构建最智能、最有用的人工智能。
因此,2024年,Adept AI与亚马逊达成反向收购雇佣,Luan带着团队里最核心的技术人员一起加入了亚马逊AGI实验室。
今年年初,亚马逊AGI实验室发布首个产品——Amazon Nova Act,一个基于亚马逊内部最强自研AI Amazon Nova延伸出来的Agent模型。
它继承了Adept AI的技术遗产(ACT-1、Fuyu模型等),又结合亚马逊的AWS基础设施,在多步骤复杂任务上表现出色。
根据亚马逊官方披露,Nova Act在Agent的公开基准测试ScreeSpot和Ground UI上取得了不错成绩。
并且在ScreeSpot界面元素定位上的表现格外优异,准确率接近94%
亚马逊AGI实验室透露,这里面的秘诀在于强化学习。
我们在亚马逊AGI实验室做的是大规模自我博弈。十几年前,DeepMind靠这种方式击败了人类。
亚马逊AGI实验室没有靠人力去给每一个操作编码,据Luan所说,他们为AI搭建了一间“健身房”。
在这间健身房里,随处可见各种常用的“健身器材”,比如ERP、CAD、电子病历系统、会计软件等。AI可以利用这些工具,通过强化学习自己摸索出正确的使用方式。
没想到,人工智能也需要健身了。(手动狗头)
看来,加入亚马逊AGI实验室后的Luan仍然谨记实用主义的信仰,一心只为打造最有用的AGI。
One More Thing
最后,八卦时间~
Adept AI最初的3名核心发起人,一位是David Luan,还有两位都是Transformer八子之一。
一位是Niki Parmar,另一位是Ashish Vaswani。
不过,Vaswani不到一年就离开了。
△
据彭博社爆料,Vaswani离开的原因是与Adept AI的某位联合创始人意见不合。
已知:Vaswani离开Adept AI时,Parmar跟着一起离开了,两人后来又联合成立了Essential AI。
求:和Vaswani意见不合的,会是谁呢?
参考链接:
[1]https://www.theverge.com/decoder-podcast-with-nilay-patel/761830/amazon-david-luan-agi-lab-adept-ai-interview
[2]https://www.youtube.com/watch?v=AU9Fdgs0ZaI
[3]https://labs.amazon.science/blog/amazon-opens-new-ai-lab-in-san-francisco-focused-on-long-term-research-bets
[4]https://www.wired.com/story/amazon-ai-agents-nova-web-browsing/
[5]https://www.linkedin.com/in/jluan/details/experience/
[6]https://x.com/jluan/status/1267097243204476932
[7]https://www.latent.space/p/adept[8]https://labs.amazon.science/blog/nova-act