近日,OpenAI官网放出了其首席财务官Sarah Friar与传奇投资人、Khosla Ventures创始人Vinod Khosla的深度对话。
针对AI泡沫担忧,Vinod明确表示,用股价波动来衡量泡沫是错误的,真正的衡量标准应当是底层的实际使用量:在互联网时代是流量,在AI时代则是API调用量。目前的API调用量完全看不到任何泡沫的迹象,现状并非需求不足,而是供给受限。
Sarah Friar佐证了这一观点,她首次详细披露了OpenAI过去三年的增长数据:
2023年:算力规模约200兆瓦,ARR约20亿美元。
2024年:算力规模增长至600兆瓦,ARR增长至60亿美元。
2025年:算力规模突破2吉瓦(即2000兆瓦),ARR超过200亿美元。

数据显示,OpenAI的算力投入与商业回报之间呈现出近乎完美线性的关系,这种高度耦合的增长曲线表明,AI产业仍处于典型的供给侧约束阶段。现在需求上限仅受制于算力的可用性。如果今天有更多的算力,OpenAI就能推出更多的产品,训练更多的模型。
虽然算力投入与回报在曲线上是对应的,但时间上存在错配。Sarah坦言,为了确保2028年至2030年的算力供应,OpenAI必须在当下就做出巨额的基建决策。
关于2026年的AI发展趋势,Vinod预判:Agent将成为绝对的核心主题,多智能体系统(Multi-agent systems)有望展现出真正可见的产业影响力。
在企业端,Agent将开始深入复杂的业务流,具备独立运行ERP等核心系统的能力,实现对账、应计费用核算及合同追踪等长链条任务的自动化闭环。
在消费端,Agent也将从单一的聊天机器人进化为具备跨应用执行能力的超级助手。以旅行为例,智能体不仅能提供建议,更能综合考量饮食偏好、实时航班时刻和个人日程等多重变量,直接为用户规划并落实一次完整的行程。
这种深度渗透在医疗领域已成现实。每周有2.3亿人向ChatGPT咨询健康问题,高达66%的美国医生表示在日常工作中使用ChatGPT。这标志着AI正加速从一种新奇的技术尝鲜,转变为专业领域的必需生产力。
站在更长远的时间维度,Vinod对未来15年的科技趋势做出了两项大胆预测:
第一,机器人在15年内的产业规模将超过汽车工业。目前汽车行业主要关注如何将机器人用于生产线,但未来的通用人形机器人市场将是一个远超汽车的庞大经济体。
第二,我们将面临极度通缩的经济环境。随着劳动成本和专业知识成本趋近于零,未来十年末期可能会出现大规模的通缩经济。这将引发社会对“人类该做什么”的深刻反思,同时也可能带来更高标准的社会基础保障。
本次对谈传递出非常明确的信号:在硅谷的核心圈层看来,AI浪潮才刚刚开始。对于企业和开发者而言,关注点不应是资本市场的噪音,而是如何利用即将到来的Agent时代,去重构那些尚未被智能化触及的复杂业务流程。
Sarah Friar与Vinod Khosla对话划重点:
1、2026年是Agent与多智能体系统的爆发之年
如果说2025年的主题是vibe coding,那么2026年将是Agent技术成熟并产生实质影响的一年。未来的发展方向是多智能体系统(Multi-agent systems)。
2、AI泡沫是一个伪命题
所谓的AI泡沫是一个伪命题,股价的波动只反映投资者的情绪,而非技术本身的价值。衡量AI真实需求的唯一指标应该是API调用的数量,从这个维度看并不存在泡沫。目前需求的唯一限制是计算资源的可用性,考虑到价格弹性,市场对智能的需求实际上是无限的。现在的状况是需求跑在投资前面,这与互联网泡沫时期流量匮乏但股价虚高的情况截然不同。
3、OpenAI的商业模式与算力投资
OpenAI的商业模式已从单一维度进化为立体的魔方结构:底层是多云、多芯片的基础设施架构,中间是涵盖ChatGPT、Sora等多模态的产品层,上层是包括订阅、SaaS、积分制及未来潜在许可模式的多元商业化体系。在算力投资上,OpenAI发现算力投入与收入增长存在极强的相关性。目前的投资决策必须提前数年布局,以确保2028-2030年有足够的计算资源。
4、企业效能新范式:人+Agent
企业应用AI不仅带来了约27%-33%的生产力提升,更改变了工作性质。AI正在接管如合同审查、条款分析等枯燥且低价值的重复性工作,让员工转向更具创造性和增长导向的岗位。未来的组织模式将呈现人+Agents的形态,例如一名员工协同五个Agent工作。对于企业而言,真正的机会在于利用AI重构核心业务流程,而不仅仅是简单的工具采用。
5、AI变革医疗健康领域
医疗健康是AI将带来彻底变革的领域,它将使专业知识商品化。目前已有66%的美国医生在日常工作中使用ChatGPT,它在辅助诊断罕见病(如非本地流行病)和提供第二意见方面展现了巨大价值。然而,该领域面临的最大阻力来自监管(如FDA)和既有体制(如美国医学会),目前的法律限制了AI开具处方或作为医疗器械被批准,这导致监管环境滞后于技术能力。
6、创业公司的护城河是独特数据与复杂工作流
在基础模型日益强大的背景下,创业公司的机会在于垂直化和复杂性。通用模型无法解决所有问题,真正的护城河建立在通过防火墙获取的独特私有数据,以及对企业内部复杂工作流的管理之上。初创企业不应试图在模型能力上与巨头竞争,而应在模型之上构建专业化的解决方案。
7、通缩型经济与免费的专业知识
未来十年末,世界可能迎来大规模的通缩型经济,劳动力和专业知识的成本将趋近于零。这意味着教育、初级医疗等昂贵服务将变得极其廉价甚至免费,每个人都能拥有AI导师和私人医生。虽然住房等硬资产问题尚待解决,但在服务领域,社会将通过机器人技术和智能的普及,进入一个物质和服务极大丰富的时代。

以下是Sarah Friar与Vinod Khosla对话实录:
1、2026年的AI趋势是什么?
Andrew Mayne:大家好,我是Andrew Mayne,这里是OpenAI播客。今天我们的嘉宾是OpenAI首席财务官Sarah Friar,以及Khosla Ventures的传奇投资人Vinod Khosla。在本次讨论中,我们将探讨AI生态系统的现状、我们是否处于泡沫之中,以及随着AI的发展,初创公司和投资者如何取得成功。
Andrew Mayne:2025年关注的是Agent和vibe coding。现在已经是2026年了,今年的主题是什么?
Vinod Khosla:我认为2025年我们在vibe coding方面已经成熟,但在Agent方面尚未完全成熟。因此,2026年将是Agent,特别是多Agent系统(Multi-agent systems)成熟并产生真正可见影响的一年。
在企业端,我们期望拥有一个执行完整任务的多Agent系统,例如为你运行ERP系统,每天自动进行对账、计提和合同跟踪;在消费者端,虽然今天规划旅行仍然很麻烦,但这将变成一个多Agent协作的任务,它会综合考虑你的饮食偏好、餐厅预订、航班时间表以及个人日程等多种因素。我认为这些从一年前开始发展的技术将在今年成熟。
此外,我对机器人学和现实世界模型(World Models)非常兴奋。这不仅仅局限于机器人学,还包括通用直觉(General Intuition)。像大语言模型中的记忆功能、持续学习能力以及减少“幻觉”影响,这些都是目前AI做得还不够好但很快会被解决的领域,值得重点关注。
Sarah Friar:我认为Vinod想表达的根本观点是,2026年是弥合“能力差距”的开始。我们把巨大的智能交到了人们手中,就像把法拉利的钥匙交给了他们,但他们才刚刚学会怎么把车开上路。
我们需要为消费者提供更多简单的方式,让他们从单纯把ChatGPT当作问答聊天机器人这种使用模式中转变过来。今天大多数人只是用它提问,但我们如何将其推进为真正的任务执行者?比如为用户预订行程,或者针对医生刚给出的建议提供第二意见,亦或是帮助患有糖尿病的孩子制定菜单?核心在于帮助用户从简单的提问转向获取能改善生活的实际结果。
在企业端也是同样的逻辑。根据我们的首席经济学家去年底发布的《企业AI现状》报告,前沿企业与中位数企业之间存在巨大差距。前沿企业的AI使用量是其他公司的6倍,而且即便是这些前沿企业,其能力也尚未被充分挖掘。
因此,我们的重点是:对于消费者,如何帮助他们沿着这条能力连续体前进,实现真正的代理任务执行?对于企业,如何打造更复杂、更垂直专业化的解决方案,使他们能从简单的ChatGPT应用一路升级,直到改变业务中最核心的部分?例如对于医疗服务提供者,可能是药物发现流程;对于医院,可能是缩短患者从入院到重返社区的时间;对于大型零售商,则是提升购物篮规模、转化率和顾客满意度。
Vinod Khosla:我想补充一个视角。我们经常看到人们把采用曲线(Adoption Curve)和能力曲线(Capability Curve)混淆了。我敢打赌,今天无论是个人还是企业,真正使用了AI 30%以上能力的人只有个位数比例。要让人们学会利用AI 30%、50%甚至80%的能力,这是一个长达十年的过程。
Sarah Friar:这就是我想强调的:AI是一个力量倍增器。虽然今天ChatGPT每周有8亿消费者在使用,这个数字本应达到数十亿,但关键是他们利用这一工具完成了多少比例的工作?这就像我们刚把家里的电接通,人们学会了开灯,却根本不知道电力还能用来供暖、做饭或卷发。现在的可能性太多了。
Andrew Mayne:我常用的一个比喻是:1990年到2000年间,电子邮件本身并没有变得更好,移动设备最初也没有质的飞跃,但使用量却大幅上升。问题不在于我们需要更好的电子邮件,而在于人们需要学习所有可以用它做的事情。
Sarah Friar:是的,移动端一直是我觉得很有趣的领域。当移动浪潮兴起时,人们最初只是把桌面网站直接搬到手机上,体验很差,唯一的优点是能装在口袋里。但后来你意识到有了GPS,于是可以叫Uber;有了摄像头,不仅可以给朋友拍照,还可以拍张支票直接存入银行账户。
这一切功能在手机出现的那一刻其实就已经具备了,只待人类的创造力去挖掘。所以你说得对,或许我们甚至不需要比今天更多的智能,就能大幅提升成果。当然,模型本身也会变得越来越智能。
2、医疗领域的AI
Andrew Mayne:你们提到了健康领域,这是一个高风险且至关重要的方面。几年前我们将ChatGPT用于简单应用,现在开始信任它处理符合HIPAA标准的数据。你们会把这看作是发展加速的标志吗?或者还有其他类似的标志吗?
Vinod Khosla:健康显然是我长期认为会被彻底变革的领域之一,它将把专业知识变成一种商品化的东西。但健康领域的问题在于监管。首先,AI能做的事情受到诸多限制。例如,即便AI在开处方方面比人类更优秀,它在法律上也不能开处方。
这不仅仅是FDA(美国食品药品监督管理局)的问题,还涉及到美国医学会(AMA)等机构在体制上对该功能的控制。因此在很多领域会遇到既有的阻力。诊断仍然是一个受限项,因为这由FDA控制,目前还没有任何AI被批准作为医疗器械。不过值得庆幸的是,目前的政府团队在迅速行动并承担适当风险方面做得非常好,我对那里的进展感到相当满意。
Sarah Friar:在健康领域,我们的数据显示每周有2.3亿人向ChatGPT咨询健康相关问题。66%的美国医生表示他们在日常工作中使用ChatGPT。
我可以从个人角度举个例子,我弟弟是英国的一名重症监护医生。他在苏格兰的阿伯丁工作,如果你因患疟疾去找他,他是很难想到的,因为那不在他的模式识别范围内。但如果你去某地度假被蚊子咬了,回到阿伯丁发病,ChatGPT或模型能做到的就是对他进行很好的增强。这解释了为什么有66%的医生在使用它,而且这个数字还在增长。
这不仅让医生能掌握最新研究成果、了解药物相互作用,也在某种程度上把自主权还给了消费者。我现在可以提前研究症状,与医生进行更有学识的对话,或者寻求第二意见。
举个生活中的例子,比如“我每天只有20分钟锻炼时间,我有1型糖尿病,我能做什么?”或者当我们带患有糖尿病的女儿外出就餐时,以前需要不停询问服务员,非常令人沮丧。现在我们可以拍摄菜单,让AI建议哪些菜最适合她。这改变了我们对吃饭这件事的看法,让我们能将重点从单纯的食物转移到家庭聚餐的陪伴上。
3、按收入扩展计算资源
Andrew Mayne:回应Vinod的观点,我认为监管环境必须赶上来。无论在哪种体制下,医疗费用的增长速度都超过了每个国家的GDP增速。我们需要AI,而且现在就需要。正如你指出的,这是历史上医疗智能成本首次同比下降。但这同时也带来了对算力的巨大需求。既然谈到算力,OpenAI在算力上的投资规模令人难以想象。OpenAI是如何确定这种需求的?你们看重哪些指标来决定投入巨资?
Sarah Friar:首先,我们努力确保算力投资与收入增长速度保持一致。我们发现期内计算投入与期内收入之间存在极强的相关性。
举个例子:2023年我们的算力约为200兆瓦,对应的年度经常性收入(ARR)为20亿美元;2024年算力达到600兆瓦,我们以60亿美元的收入结束该年;而到去年2025年结束时,我们的算力达到2吉瓦,收入则超过200亿美元。这显示出增长一直在加速。
虽然算力投入和收入在曲线上是对应的,但时间上存在错配。我必须在今天做出决策,以下订单并发出建立数据中心的信号,以确保我们在2028、2029和2030年有足够的计算资源。如果今天不行动,未来就不会有。
目前,我们感到在计算资源上绝对受限。如果有更多算力,我们可以推出更多产品、训练更多模型、探索更多多模态内容。这种趋势不仅限于OpenAI,去年全球整体硬件投资增加了约2200亿美元,芯片预测也上涨了约3340亿美元。整个环境都在传递一个信号:AI是真实存在的。
我们正处于范式转变之中。我们需要投资,赋予人们完成刚才讨论的所有事项所需的智能。在OpenAI内部,我们投入了大量时间深入研究消费者、企业和开发者的需求信号。
我们首先从基础层思考整体布局。在基础设施层,我们思考如何创造最大的可选性,因此我们希望实现多云、多芯片架构,这为基础设施层增添了一个有趣的维度。
往上是产品层,我们也致力使其更加多维。过去我们只有ChatGPT,而今天,面向消费者的ChatGPT内置了包括医疗在内的所有模块;我们还有面向工作的ChatGPT,以及作为新平台的Sora和一些变革性的研究项目。
再进一步,我们的商业模式生态系统也正变得日益多元化。起初为了支付ChatGPT的计算成本,我们只有一种订阅模式。现在我们不仅有多个价格点的订阅服务,还面向企业推出了SaaS定价,并针对高价值场景采用了基于积分的定价模式,因为用户愿意为更高价值的服务支付更多。
我们也在考量商业化和广告等方向。从长远来看,我倾向于能实现真正利益对齐的模式,比如许可模式。假设在药物发现领域,如果我们授权技术帮助客户取得了突破,一旦药物畅销,我们就能获得相应的分成,这与客户的目标高度一致。
如果把这三层结合起来,我把它想象成一个魔方。我们从单一模块、单一云服务商(微软)、单一芯片、单一产品和单一商业模式,发展到了如今这个完整的三维立方体。魔方大约有4300亿亿种不同的状态,这让我着迷。想象一下转动这个魔方:我们可以选择一款低延迟芯片,配合编码等人们期望提速5倍的应用,并为此收取高端订阅费。这就好比魔方的一面拼出了三种颜色。我们也可以再次转动魔方,利用低延迟芯片和更快的图像生成技术吸引更多免费用户,从而为潜在的广告平台创造更多库存。
过去12个月,我们的目标就是创造越来越多的战略选项,确保持续有能力支付实现使命,即造福人类的通用人工智能(AGI)所需的计算成本。
Vinod Khosla:简而言之,目前需求的唯一限制就是计算资源的可用性,无论是Sora还是更广泛的应用都是如此。考虑到价格弹性,对计算资源的需求实际上是无限的。我们甚至还没开始利用价格弹性这个杠杆,仅仅是因为受限于计算能力而无法满足现有需求。因此,那些谈论“泡沫”的人完全搞错了方向。他们没有意识到这场变革的规模,以及API调用需求的弹性增长空间有多大。

4、AI时代与互联网泡沫时期的区别
Andrew Mayne:作为OpenAI最早的投资者之一,你很早就押注了我们。你曾亲历过互联网泡沫,也见证过移动革命等其他变革。我想问,你对AI的坚定信念是否源于它触及了如此广泛的领域?
Vinod Khosla:当初投资时,我们的衡量标准非常简单:没有任何可供参考的预测、产品计划或ChatGPT。只有一个核心理念:如果开发出的技术接近甚至超越人类智能,其影响将是巨大的。这是一个基于宏观后果的判断,既然成功的收益如此深远,为什么不去尝试呢?
关于泡沫这个概念很有趣。人们习惯把泡沫等同于股价,但这除了反映投资者之间的恐惧和贪婪外,说明不了任何问题。我认为泡沫应该用API调用的次数来衡量。回顾所谓的互联网泡沫,如果我们看当时的互联网流量,即便股价剧烈波动,流量本身并没有出现泡沫。同样,我可以保证,如果以API调用数量作为衡量AI真实用途、实用性和需求的基本指标,你根本看不到泡沫。
我并不关心华尔街如何解读,这大多无关紧要,只是给媒体提供了填充版面的素材。股价或私有公司估值并不是现实,现实是对AI的实际需求,也就是API调用的数量。
Sarah Friar:确实如此。回看1999年,当时人们从互联网获得的价值还非常初级,很难看出它如何改变生活。但我认为AI带来的变化发生得非常快,而且非常真实。
作为一名CFO,我在组织内部看到的真实情况是:我们可以把以前那些需要不断增加人手去做的、相当枯燥的工作,真正交给系统去完成。以收入管理(Revenue Management)为例,团队以前每天都要下载前一天签署的所有合同,阅读并检查是否存在可能导致收入确认变更的非标准条款。这对财务团队至关重要,也是审计的重点。随着我们业务成倍增长,在没有AI的世界里,我唯一的选择就是雇佣更多人去日复一日地阅读合同。这种工作既平庸又乏味,并不是人们学习会计或金融的初衷,但这曾是我们提供的入门级工作。
如今在OpenAI,我们利用自己的工具,系统会在夜间提取所有合同并存入Databricks数据库。Agent会遍历这些数据,准确指出哪些条款不规范及其原因,并建议如何进行收入确认。更重要的是,它能提供洞察,比如某个条款是否属于销售人员的违规操作,这就需要我去进行指导;或者这是否暗示我的业务模式正在发生转变,某些非标准条款其实应该标准化。这可能是一件好事,促使我找到新方式既满足客户和销售的需求,又保持商业模式的健康。而那些初级员工则可以从枯燥的工作中解脱出来,转向更有价值、他们更热爱的工作领域。
对我来说,这就证明了这不是泡沫,因为价值是真实可触及的。这意味着我可以拥有一个规模更小但绩效更高、士气更高、留存率更好的团队。我可以用数据证明业务变得更健康了。媒体用“泡沫”来引导舆论的问题在于,他们忽略了我们是在追随需求进行投资,目前甚至是需求跑在前面。所谓的“泡沫”通常是指投资超前于需求并造成了缺口。
Vinod Khosla:看看生产力数据就知道了。那些正在采纳AI的公司,特别是新一批技术导向型公司,生产力都在显著上升,数字令人惊叹。我最喜欢的例子是一家叫Slash的小公司,年经常性收入(ARR)约1.5亿美元,但会计部门只有一名总账主管,因为他们采用了以AI为导向的ERP系统取代了NetSuite。他们CEO甚至向我道歉,说可能得雇第二个人了。还有一个新闻是,有人用一个AI销售开发代表(SDR)替代了10个传统SDR的工作,剩下的一名员工只需负责监督。
Andrew Mayne:我听到两种说法:一种是不再招聘人手做某些不能带来增长的工作;另一种是现在可以把招聘名额用在能为公司创造更多增长的人才上。这就是许多科技公司发展如此迅速的原因。
Vinod Khosla:正所谓“未来已来,只是分布不均”。我看到单点上巨大的生产力、效率和敏捷性提升,但全球只有极小比例的人采用了这些技术。随着时间推移,这些案例会传播开来,技术采用率将呈指数级增长。所以,需求完全不是问题。
Sarah Friar:Vinod说得完全正确。麦肯锡的研究显示,处于前四分位的公司生产力提升了约27%到33%,这是非常有意义的增长。这不仅仅意味着减少员工,而是必须把人员转移到更侧重增长的岗位上。
我最近遇到一位大型咨询公司的负责人,她把现在的组织模式称为“人加Agents(people plus agents)”,采用一比五的比例,即一名员工对应五个Agents。但在前端,他们实际上又开始重新招聘扩张,因为客户现在需要更多帮助来部署AI。所以工作并没有消失,而是回到了人们真正想做的创造性工作,而不是单纯解析海量信息。现在,我们终于可以让机器和Agents来处理信息解析了。
5、ChatGPT中的广告
Andrew Mayne:回到消费者端,你提到了广告。我们的观点是,通过广告可以增加收益,从而提供更多服务和AI能力,帮助支付计算成本,让用户从免费层级中获得更多价值。但这引出了信任问题。用户担心ChatGPT如何处理信息,一旦引入广告,人们就会担心这会如何影响产品和组织。
Sarah Friar:首先,目前的现实是我们95%的用户在免费使用平台。我们的使命是造福全人类的AGI,而不仅仅是造福付费用户,因此提供广泛的获取途径至关重要。关于广告,第一,我们必须确保每个人都明白,你永远会获得模型能提供的最佳答案,而不是付费推广的答案。其他平台在这方面已经倒退,用户分不清是赞助链接还是最佳结果,而我们的北极星原则是模型始终给出最佳答案。
第二,广告可以带来实用价值。例如,如果我搜索周末去圣地亚哥的短途旅行,Airbnb的广告可能会非常有用。在这种情况下,用户甚至可能希望在ChatGPT环境中与广告主进行深度对话,但前提是必须清楚这是广告场景。我们需要创新,让广告看起来是平台固有的一部分,而不是老旧的横幅广告。
第三,必须保留一个无广告的层级,给予用户选择和控制权。我们非常重视数据隐私,比如在推出Health功能时,我们明确表示数据是隔离保存的,不会用于训练。信任对OpenAI来说就是一切,即便涉及广告,我们也会坚守这些原则。
Andrew Mayne:在消费者方面,未来会不会变成一个用户订阅多种不同AI服务的世界?
Vinod Khosla:我认为用户会使用各种模型,大多数人会有不止一个订阅。媒体行业就是很好的例子,大多数人拥有多个媒体订阅,这是消费者行为的一个很好参照。不同的人会选择不同选项,包括由广告支持的免费选项。即使是同一项服务,你也可以选择付费或免费。市场将呈现广泛的多样性。
6、消费者会不止订阅一项AI服务吗?
Sarah Friar:那你如何看待转换平台的成本?我很喜欢ChatGPT的记忆功能,它越来越有用,因为它能记得几周甚至几个月前我们讨论的内容。我现在每天醒来使用的Pulse功能(目前尚未广泛推广)非常惊艳。当你把它连接到日历时,它不仅会推送我感兴趣的AI数据中心内容,还会提醒我今天要在日历上和Vinod见面。记住这些细节非常有帮助。
但这涉及到多平台使用(multi-homing)的问题。如果我在多个地方同时使用AI,我就无法享受到统一记忆的好处。这跟同时订阅《华尔街日报》、《经济学人》和《纽约时报》不同,去别处阅读不会让我受损。但在AI领域,分散使用会导致记忆断层。
Vinod Khosla:是的,“记忆”确实是一个重要问题。未来可能是每个设备有一个模型的记忆,或者是多个模型各自拥有记忆。即便在OpenAI的模型上,也会有多个服务提供者提供不同的权衡取舍。这就是多平台使用的概念。显然,OpenAI不会占据100%的市场。
Sarah Friar:这是一个有趣的商业模式。人们很难理解这一点,因为它不像Netflix那样受限于用户有限的时间。我把它看作是基础设施,更像电力。
如果你问我一天用多少电?我不知道。我今天走进一个房间,风扇在吹,感觉很舒服,灯也亮着,但我并没有意识到电的存在。就像我把手机整晚充电,第二天就能用一整天一样。
目前的现状是,我们更多是在主动调用ChatGPT,去唤醒它,而不是让智能自然地内置于背景中。我认为这将是未来几年最大的变化。回过头看,你会觉得我们现在做的事情像玩具一样。未来,智能将无处不在,环绕在我们周围。
我不认为人们的时间是有限的,所以我不会纠结于此。我生活中几乎每一件事都需要智能,即使是行走,我也希望大脑中有智能在运作。如果我们能增强这种智能,结果将令人震惊。这就像你第一次发现手机上有手电筒和相机时的感觉,事后看显而易见,但当时却是革命性的。
每次使用ChatGPT,哪怕是发现一个小小的用例,我都会被震撼。比如昨天早上,我很想读《经济学人》的一篇社论,但我没时间阅读,因为我要赶着上楼准备。于是我拍了照片,让ChatGPT读给我听。它做到了,体验太棒了。我们才刚刚起步,而多模态将是最大的变革。手机教会了我们用拇指交流,而新世界的新硬件将帮助我们理解:我们可以听、说、看、写。我们将以一种非常接近人类本能的方式完成这些事情。
Vinod Khosla:让我换个角度补充一点。回看互联网泡沫时期,互联网所做的是极大地扩展了你接触信息的渠道,无论是媒体、YouTube视频还是TikTok。信息量爆炸到了人类无法完全利用的程度。我把AI看作是在你每天有限的清醒时间里的补充,它能筛选信息,让你利用它的每一小时都成为最高效的一小时。智能会将世界缩减为对你个人最相关的事物。我可能和Sarah有一套不同的优先级,智能会分别为我们总结对各自最相关的内容。
7、AI时代企业端如何取得成功?
Andrew Mayne:我们要谈谈企业端的问题。OpenAI在消费者端很有优势,但在企业端,OpenAI将如何竞争并取胜?
Sarah Friar:我认为我们已经在企业端胜出了。90%的企业要么表示正在使用OpenAI,要么计划在未来12个月内使用。微软也在使用我们的技术,这是另一个重要因素。
实际上,消费者业务是推动企业业务发展的巨大飞轮。正如早年人们第一次把iPhone带到工作场所,尽管企业最初抵触,但最终无法抵挡消费者偏好的潮流。当我在生活中习惯了某种工具,我会期望工作中的工具至少要一样好,甚至更好。这就是推动我们企业业务增长的原因,使我们成为最快达到100万家付费企业的平台,这一过程大约只用了一年半。
但这只是冰山一角。下一步是深入垂直领域,用客户的语言与他们交流。企业销售的艺术在于:不是推销产品,而是先了解问题。我们要问CEO:董事会强制你做什么?你的客户想要什么而你无法提供?然后我们将智能应用到这些问题上。
我们可以从轻度垂直化发展到深度垂直化。例如在能源公司,利用强化学习模型真正理解特定的油井或地震数据,以判断气田的回收量。此外,我们正在推进一些变革性的研究项目,实际上是接管公司某部分的业务,帮助他们以更聪明、更快速的方式重构业务流程,从而推动关键指标。
这是一个旅程。大多数企业从全面部署ChatGPT开始,这只是起步。很多企业已经开始利用AI进行编码。我和一些CEO交流时,他们会说:“我60%的生产代码现在是由Agent构建的。”而在12个月前,他们甚至不知道生产代码是什么。
在Agent方面,一切才刚刚开始。目前只有约14%的美国企业在使用某种代理式解决方案。正如我提到的财务部门的案例,机会是巨大的。
Andrew Mayne:如果我是创业公司,看到OpenAI做的一切,我会问:还有我的空间吗?
Vinod Khosla:模型会不断进化,能力越来越强,但我确信在模型之上还有巨大的构建空间。没有哪家公司能包揽一切。全球有数十亿人在工作,AI能辅助他们。OpenAI不可能在每个领域都做到专业化。
对于创业公司,谨慎的做法是明确基础模型(无论是OpenAI还是其他家)的发展方向和能力边界,然后专注于更有趣的领域,在基础模型之上增加某种专门化。单靠智能并不是解决方案的全部,解决方案周围还有很多配套要素。模型越强大,依附于其上的机会就越多。
Sarah Friar:我经常思考那些聚合了大量独特数据的用例。世界上95%的信息实际上都在公司或大学的防火墙后面。那些已经建立了业务并汇总了这些数据的公司,拥有独特的优势。除了数据,他们还管理着复杂的工作流。
以采购系统为例,系统本身并不复杂,但它擅长理解授权委托等逻辑。它知道董事会批准的审批限额,知道超过某金额必须由我批准,低于某金额可由副总裁批准;它还能访问HR系统确认员工职级。这种结合了合规与治理的复杂流程,能让公司运转得更快。这就是我对创业公司感兴趣的领域:你在哪里能获取具有复杂工作流的独特数据?这才是护城河,我们希望能与这类公司合作。通用模型无法独自完成所有这些工作。
Vinod Khosla:我完全同意。机会非常多。我见过不少初创公司专注于数据权限管理,即谁可以访问哪些信息。也有很多公司专注于为企业定制模型,以适应其历史数据和优先级。
Sarah Friar:关于Agent,尤其是代理的身份认证方面,当Agent之间开始交互时,会产生新的风险和权限设定问题,甚至衍生出“代理式商业”(Agentic Commerce)。这种即将到来的复杂性是巨大的。所以,现在做初创公司可能从未像现在这样有趣或充满吸引力。
Andrew Mayne:当你与一家公司交谈时,什么会让你感到兴奋?
Vinod Khosla:最难的总是找到优秀的人才。但我认为长期短缺的是主动权(Initiative),即人们让事情发生的能力。归根结底还是人的问题。传统的因素,如熟悉某个领域或拥有该领域的经验,现在已不那么重要了,更重要的是主动性。
8、机器人与未来愿景
Andrew Mayne:我们还没谈到机器人、现实世界模型这些领域。您曾谈到过2050年的愿景,现在模型发展这么快,您怎么看机器人的发展方向?
Vinod Khosla:我在两年前的TED演讲中说过,机器人行业(不论是双足还是其他类型)在15年内的规模会比今天的汽车行业还要大。汽车行业已经是地球上最大的行业之一,而机器人行业将由智能驱动,规模会更庞大。目前很少有汽车公司以这种宏大的视角看待世界,他们只想着如何在装配线上使用机器人。这对初创公司来说是巨大的机会。
Sarah Friar:是的,我们有时会低估这其中的潜力。以家庭机器人为例,虽然目前还没有真正的突破,主要受限于复杂性问题。在AI领域待得越久,我越对人类在物理世界中移动和做事的能力感到敬畏。
大家可能会为机器人能叠衣服感到兴奋,这当然很好。但我们容易陷入一种观念,觉得机器人必须像人类一样做所有事。实际上,突破点可能在于更感性的层面,比如陪伴。随着人口老龄化,孤独是最大的流行病之一。对于独居老人,有人能以直观、有人情味的方式与他交流是最宝贵的。我们看到越来越多的人使用ChatGPT进行这种对话。
未来的突破可能不需要机器人会做咖啡或洗碗,而是一些更简单的功能,但这能带来巨大的价值。这正是Vinod所说的“爬行、学走、奔跑”的过程,其综合价值可能比汽车行业高出好几倍。
Andrew Mayne:有趣的是,我们现在正处于可以用机器人替代某些劳动的阶段。当你可以极低成本地获得劳动力和制造能力时,世界将发生巨变。例如,当建设一流辅助生活设施的成本大幅下降,将会带来深远影响。这真正意味着什么?
Vinod Khosla:我个人的观点是,可能在下个十年末,我们会看到一个大规模的“通缩型经济”。因为劳动力将接近免费,专业知识将近乎免费,大多数功能的成本将趋近于零。虽然具体购买力与商品生产如何互动还难以精准判断,但我预计通缩程度将远超人们预期。
这涉及到社会层面的适应问题。人们将如何谋生?我经常被问到这个问题。我认为政府能够保障的最低生活标准将会比现在高得多,而且无需通过赚取收入来实现。我无法想象现在的初级医疗服务如果好上十倍,而成本只需每月一美元是怎么做到的,但这将成为现实:免费的初级医疗、免费的教育几乎不需要成本。几乎每个人都会有AI辅导,每个孩子都有私人导师,这已经在发生了。
所以,将会有一系列服务变成免费的。当然也有棘手的问题,比如住房。对于美国收入后50%的人口来说,住房和食物占了他们收入的40%以上。但我确实认为,通过机器人技术和更好的方法,这些问题最终都能得到解决。

