a16z将3000万开发者标价3万亿,等于法国GDP,网友:几个初创公司+大模型就想取代我们,疯了吧?
来源:36kr 8 小时前

当顶级风投 a16z 的合伙人面带微笑地算出这笔“人力资产化”的账——把全球开发者群体的价值量化为 3 万亿美元,并与法国 GDP 划上等号时,他描绘的是一幅由 AI 编程颠覆生产关系、释放巨量价值的资本盛景。

他在访谈中兴奋阐述:“全世界约有 3000 万名开发者,假设每位创造 10 万美元价值……合计约 3 万亿美元,相当于法国的 GDP”,还进一步强调,这个量级“也大致相当于几家正在重塑 AI 软件开发生态的初创企业再加上他们使用的基座大模型的价值总和。”

他还有一整套关于“软件颠覆软件”的激进判断:任何重点大学的传统 CS 课程或将成为“过往时代的遗留”;LLM 能写 COBOL、Fortran、CUDA 内核,甚至“有了智能体,哪怕完全不懂 CUDA 的开发者也可以对这类代码进行审查和改进”;还有一个可能让开发者背脊一凉的趋势:软件开发能力从“人工薪酬”转为持续消耗 Token 的“基础设施成本”。

不过需要提醒的是:a16z 本质上是一家投资公司,其表述更多代表资本方视角。当人类创造力被直接折算为宏观 GDP 的财务口径时,难免引发质疑与反讽。对此,有网友评论道:“开场就把行业从业者简化成金钱价值,再把几家初创的产出与整个人群的经济贡献划等号,最后还拿全球第七 / 第八大国的 GDP 来背书——全程一脸得意,主持人也在旁边笑……”另有网友指出,这种乐观态度忽视了关键问题:“无奈坐视时代变迁,却不知道该如何适应,这不正是最大的危机吗?嘴上说着开发者不必担心生存,却拿不出什么真凭实据…还一副言之凿凿的样子,真的无语。”

他一开始就把一个行业里的人贬低成了金钱价值,然后用几家初创公司创造的经济产出,来与这些人(的产出)划等号,接着再把这个数值量化成全球 GDP 排名第七或第八大国家的体量。整个过程中,他脸上挂着沾沾自喜的笑容,主持人也在一旁大笑。向“技术封建主义”致敬吧——一个看似反乌托邦的未来,对经济替代毫不在意,却还有人为此兴奋不已!真是讽刺。

无奈坐视时代变迁,却不知道该如何适应,这不正是最大的危机吗?嘴上说着开发者不必担心生存,却拿不出什么真凭实据…还一副言之凿凿的样子,真的无语。疯了吗?

Guido Appenzeller 是 Andreessen Horowitz(a16z)的合伙人,专注于 AI 基础设施和前沿技术投资。他曾担任 Intel 数据平台事业部 CTO、VMware 云与网络 CTO,并创办过多家初创公司(如 Big Switch Networks、Voltage Security),在网络虚拟化和企业安全领域有丰富的技术与创业经验。

本文为该期播客的完整中文翻译,尽量保留原意与上下文细节,便于你独立判断:这究竟是一场值得欢呼的生产力革命,还是被包装过度的资本叙事?欢迎读完后在评论区留下你的观点。

价值三万亿美元的 AI 编程机遇 

Yoko Li:你提到 AI 编程是人工智能第一个真正意义上的大规模应用市场。能不能详细解释一下这为什么能成为激动人心的商业机遇? 

Guido Appenzeller: 我确实认为 AI 编程是人工智能第一个真正意义上的大规模应用市场,毕竟已经有大量投资涌入。现在的问题是价值在哪里,我们为什么要参与其中。

首先,AI 编程确实可以创造巨大的价值。全世界约有 3000 万名开发者,假设每位参与者创造 10 万美元的价值——当然,在美国这个数字还不止 10 万美元,毕竟很多人的薪水远高于此。但大致就是 10 万这个数量级,那粗粗估算的话,整个开发者社区创造的价值大约就是 3000 万再乘以 10 万,相当于 3 万亿美元。这还只是专业的开发人员,还有其他对开发感兴趣的参与者。现在设计变成第一要务了,每位设计师、产品经理乃至很多作家都会写代码。这绝对是巨大的影响。

而且从 3 万亿美元这个数字来看,基本相当于法国的 GDP——即全球第七、还是第八大经济体的全部人口创造的价值,也大致相当于几家正在重塑 AI 软件开发生态的初创企业再加上他们使用的基座大模型的价值总和。

Yoko Li:你谈到软件颠覆了一切,但现在软件本身也正在经历大规模颠覆。这一切在实践中是怎么体现的? 

Guido Appenzeller: 确实,如今我们看到、接触和使用到的一切都是软件。软件颠覆了全世界,如今软件本身也正在经历巨大颠覆。现在我们越来越多使用语言模型来编写代码并生成软件。但结果并未造成工作岗位减少,而是让软件产出越来越多。以往需要借助 SaaS 服务才能满足数百乃至数千人的需求,如今 AI 编程让一对一编写代码和软件成为了可能。比如我就专门给自己编写了电子邮件过滤器。我不大用语言模型回复邮件,但我确实做了个过滤程序,可以做标签分组这类工作。当然,只针对某些邮件。

Yoko Li:随着 AI 智能体的兴起,你认为开发流程将发生哪些变化? 

Guido Appenzeller: 我觉得答案很复杂,而且目前讨论还为时过早。我认为在这场 AI 革命当中,当下还得不出完整的答案。大家都有自己的技术栈,有自己的软件开发生命周期,现在来看其中每个环节都在经历颠覆。不再只是传统开发者才编写代码,而是价值链上的每位参与者都在经历颠覆。

要说让我印象最深刻的编程颠覆领域,那就是传统编程 IDE 正越来越多集成进编程辅助或者编程智能体,比如 Cursor、Devins、GitHub Copilot 和 Claude Code 等等。这些 AI 开发工具带来了令人难以置信的收入增长,几乎成为整个 IT 创业历史上收入增长最快的领域。价值数十亿美元的收购和交易频繁出现,总之这是个相当活跃的领域。

Yoko Li :你提到的基础开发循环(规划、编码、审查)正在发生变化。你觉得未来这个循环还会存在吗,还是从根本上发生转变? 

Guido Appenzeller: 我觉得目前很难预测最终结果,但我们也许可以从世界上的第一封邮件中窥见端倪。有了第一封通过互联网发送的邮件,就能大致推测未来会出现网站之类的成果。举个有点牵强的例子,每个人都把自己的房子拿出来租赁、跟酒店竞争,就能形成全球体量最大的酒店业务体系——这就是 Airbnb。所以我觉得这些次生效应真的很难预测。我个人的猜测是,未来软件开发者仍然会存在,只是工作内容会完全不同。

坦白讲,目前任何一所重点大学的计算机科学课程都将成为过往时代的遗留,相比之下那些顶尖初创公司所做的事情、他们采取的开发循环也跟学校里教的完全不同。

初创公司会使用大量智能体,通过提示词传达一些上下文信息。这代表整个创作视角上升到了更高的抽象层次,无疑是一场巨大的飞跃。未来的开发循环是什么样我不知道,但我有种直觉,可能会有更多开发者来观察规划的执行周期。

Yoko Li :随着智能体承担的任务越来越多,人工审查的角色会发生怎样的变化?人类还需要审查代码吗?还是说智能体自己就能处理? 

Guido Appenzeller: 我认为智能体自主运作的时间会更长。但如果有人想为自己的跨国企业编写一套完整的 ERP 系统,那我肯定不敢相信单靠智能体就能生成真正符合要求的成果。我认为问题在于,模型距离能够完全自主运行还很遥远。但换个视角,全人类团队在项目启动之初可能也没有理解所有挑战。人类开发者需要审视设计、架构和成本等等,然后发现原本的规划存在问题、或者发现了新的挑战。所以我觉得循环仍然会存在,也许在时间尺度上会有改变,但现在真的很难预测。

另外我们还频繁观察到另一种现象,人类介入循环的程度越来越低,转而为智能体提供工具、让它们知道自己该做什么。以往我们习惯于参考开发文档,再提取内容告知智能体该做什么;而现在的智能体可以自行调用 API 来填充上下文,可以省去中间人。再拿验证为例,以往我写代码或者审查别人的代码时,会做的第一件事并不是直接审查。我这人不喜欢读代码,所以会先做 fork 修改,看看还能不能跑。如果改了之后跑不了,那我就不审查了。现在我们有机会让智能体拥有一套原生环境,同样看看功能还起不起效、UI 看起来还正不正常,所有请求还能不能通过。

总而言之,我觉得智能体发展到今天的程度,真的很需要专属于自己的环境来运行这些。我以往常给自己写点小工具,比如某个解决具体问题的小脚本。过去我肯定不会为这种工具写单元测试,毕竟这也不是什么生产级的代码。但有了智能体,现在我可以引入单元测试,让智能体帮我了解变更会不会破坏其他功能。这肯定是非常非常有价值的。

Yoko Li :你认为在这条价值链中,哪个环节产生的经济价值增速最快?目前 AI 智能体的杀手级用例又是什么?下一个腾飞点又会出现在哪些领域? 

Guido Appenzeller: 每年我会跟上百家企业讨论这个问题。根据对方的反馈,目前投资回报率最高的用例是遗留代码移植。谷歌在这个领域就发过一篇很棒的论文,就是在一套体量极其庞大的代码库中把旧代码替换成 Java 代码。这事听起来很平凡,但这种处理遗留技术栈的方式非常重要。比如说吧 Cobol 或者 Fortran 转换成 Java。Cobol 这个词真的很多年没提过了,我只写过一次 Cobol 代码,还是在上世纪 90 年代。

现在有了大语言模型,可以靠它根据企业指定的规范重写遗留代码,而且效果还挺好的。根据我的观察和交流,跟传统流程相比,企业大多表示这种方式速度更快,而且也在增加开发者的招聘数量。我不敢说这能否成为长期趋势,但企业环境下确实有很多长期存在的问题,只需要一点前期投资就能节约下大量基础设施成本。比如说大型机业务就是个很有前景的领域,这波转变突然就让遗留代码的迁移难度大大降低了。大型机编程能力在人才市场上相当稀缺,但现在更多人可以用自然语言编写这类代码。所以从另一个角度来看,底层遗留编程语言也有可能迎来复兴。

另外编程助手的功能之强大让我相当震惊——我见过它们编写 CUDA 内核,这可是很有难度的任务。我甚至尝试过用一种几乎没有训练数据集可用的语言来实验,大模型仍然能够抽象出代码的形态。虽然还称不上完美,但我觉得应用空间应该会很大、很广泛。

Yoko Li :随着 AI 智能体越来越普及,代码审查的概念正在怎样演变?未来我们会不会只需要审查计划,而不必关注具体的代码行?比如两句话 + 一个可运行环境就够了? 

Guido Appenzeller: 你说得没错,大模型确实很擅长生成代码,实际表现甚至经常超出我们的理解和预期。另外我说个几乎没有争议的观点,就是开发者花在代码审查上的时间其实比编写代码还要多。而且人类也真的不太有能力审查成千上万行代码,所以对于大体量的 PR 实在没有太好的处理办法。除非是那种纯靠氛围编程搞出来的、只是一次性的试水性成果,其他程序代码都需要进行逐行审查。而现在有越来越多的强大 AI 工具可以直接对 PR 进行分析和审查,指出安全漏洞并发现有违规范的部分。比如说提示那些不该使用的依赖项,强制执行编程规范等等。

当然,我自己还没见过有谁完全依靠 AI 来审查代码,但确实有企业反映已经把两位专职代码审查开发者缩减到一位。他们靠的就是向 AI 智能体委派任务,好像突然之间就多了很多人手,人类开发者要做的只是为其提供上下文、提醒其需要注意哪些变化。当然,代码审查这个表述也不够准确,因为审查关注的可以是功能、也可以是性能。

但现在有了智能体,哪怕完全不懂 CUDA 的开发者也可以对这类代码进行审查,通过多次验证来做出改进。我也不知道大模型能不能准确理解 PR 中的每行代码是怎么工作的,又该在什么样的环境下测试,但目前来看确实有希望。

还有另一个很重要的方面,那就是大模型在生成代码文档和描述方面也非常出色。比如在使用 Cursor 这类工具进行编程时,我常会在事后询问它,然后参考内部文档再做更新。毕竟内部文档非常重要,可以随时作为参考。我们当然不可能每次都把整个代码库都塞进上下文窗口,这样效率太低、速度太慢。但现在我们可以直接让它阅读文档,再以此为基础实现新的子类,整个流程会快得多。编译器为什么重要,就是因为它能将高级抽象转换为低级抽象。而有了大模型,只要我们手动优化低级抽象,就能靠智能体来更新高级抽象。

从这个角度来看,大模型就是 AI 时代的新型编译器。目前智能体最大的缺点就是不像编译器那样拥有可以直接验证功能的原生环境,但随着时间推移,我们也许能为大模型提供工具,让它在语法层面解析代码和推理代码,比如确定对象 X 的表示在序列化后的不同模块中是否相同。而且智能体能做的事情非常多,从社交(关注其他开发者在做什么)到软件分发都行。

另外还有个有趣的趋势,就是大家对 git repos 的使用方式也开始改变。以往人们会先修改、再提交,之后其他人才能看到。这样打开 PR 时,大家就能看到不同的修改版本。但现在智能体会一次性做大量修改,导致提交的东西在多;相比之下,repos 是专为人类开发者设计的,所以速率限制设置得很低。我觉得 repo 会逐渐迎来新的形态,比如允许智能体一次探索五种不同的路径,在发现其中的最优解之后才返回给 GitHub。

我觉得这有可能彻底改变人类编写代码的方式,或者说越来越多的编写任务会从人类转向智能体。在这种情况下,原本针对人类情况设计的底层服务肯定是不足以支撑这个全新智能体时代的。而且我们不妨把情况想象到极致,比如未来我一个人会并行运行 100 个智能体,它们都在尝试帮助代码库实现功能。因此各智能体间肯定需要某种协调机制,确保它们不会同时尝试编辑同一个文件。

另外它们还得在所处理的代码仓库上共享内存,以免每个智能体都重新加载依赖项。那我们肯定是需要一些更灵活、更实时的东西,匹配新时代下以智能体为主的开发方式。而且这套思路不仅适用于 GitHub,我们也许可以真正自下而上开发相应的开发体系,为 AI 构建出前所未有的编程环境。这种贯穿编程、测试和审查的全新技术栈设计思路绝对让人兴奋,对吧?

Yoko Li :AI 智能体领域出现了哪些新工具?未来的智能体还需要补齐哪些拼图? 

Guido Appenzeller: 目前还有另外一种非常有趣的行为变化。其实咱们开发者也都挺懒的,能不看文档就尽量不去看文档。哪怕是看,也只看其中特定的部分,而且是粗略浏览。而智能体不只是简单提取文档,而会根据上下文进行查询。

其实上下文工程对于人类也很重要,我们的大脑跟大模型非常相似。我们需要上下文,智能体也需要上下文,由此大致可以推断智能体接下来还需要配合哪些工具。另外还需要具备安全保障的环境,而且大模型还会产生幻觉,并会在被恶意提示词干预的情况下去做坏事。

目前市面上已经出现了一些有趣的搜索工具和解析工具。比如我面对一个非常庞大的代码库,突然出现问题时,我们需要向一个广泛使用的库中某函数添加一条参数。那这个库具体在哪里使用?这就是个很难回答的问题。很明显,简单的查找操作没办法找到这些东西,往往需要语法解析才能确定。正因为如此,市面上出现了一些针对智能体优化的文档工具,帮助智能体查找这些内容。

我很期待智能体可以进行网页搜索之类的操作。此外还出现了更多专业性更强的模型,比如代码编辑,或者对文件进行重新排序,这肯定会形成相应的市场空间。那既然这里拥有巨大的价值创造机遇,肯定会有相应的初创企业出现。

如果一年半或者两年之前问我,我很难判断这类开发工具能有多大的市场规模。但如果今天再问,大家会相信这是个价值数千亿美元的市场,理论上甚至能够达到万亿级别。那这个领域能容纳多少新公司呢?我不知道,但可能有几百家。虽然随着时间推移这些企业会逐渐融合,但我觉得这远不只是种商业模式,而会成为一整个生态系统。

Yoko Li :随着智能体承担的工作越来越多,开发者生产力的衡量指标会发生怎样的变化?传统的提交变更会不会被取代? 

Guido Appenzeller:确实,GitHub 刚诞生的时候大家都很重视提交变更,认为提交量与开发者创造的价值息息相关。比如你做了多少次提交、修改了多少行代码等等。但现在大家都知道了,这些僵化的指标并不足以准确衡量价值。那么下个时代的提交变更会以什么样的形式存在,又会是什么样子?这个问题确实非常重要。比如我们一个周末用掉了 1000 万个 token,如果这样的成本对应根本无效的提示词或者持续操作,那就没法代表真实的工作产出。比如我可能只是把整个代码库全塞进上下文窗口了。那使用的智能体数量说明问题吗?会不会更能体现开发者交付的价值?这个我也不确定,一直在深入思考。

我们评估软件开发的标准也在发生变化。大规模复杂重构工作可能不再那么繁琐,因为很多工作可以让大模型来做。这时候对于那些训练数据不足、执行标准非常模糊的领域对大模型进行手动优化,可能就成为人类开发者最有价值的工作内容。所以说……这确实挺复杂的,也许未来的标准是我们编写的应用程序数量。再说回智能体编排,现在我们不仅可以使用一个智能体,而是可以使用多个智能体、甚至是一个智能体的不同副本,让它们并行执行任务。在这样的多智能体编排体系下,我们能做到哪些以往做不到的事情?

这些都有很大的想象空间,我们可以并行尝试,看看哪种效果最好。比如说人们想要优化一段代码,就可以启动好几个优化方法不同的智能体,然后衡量哪个最好用。有些初创公司甚至认为自动化程度还能更高一些,很大程度不需要人工干预,只需要下达优化的指令就让智能体在后台启动和运行。但这一切最终都需要消耗大量 token,我觉得这是个非常有趣的趋势。三个月前好像还没人聊过编码编排的成本,不信大家上 Reddit 上的 Cursor 子论坛,就知道三个月前还没啥帖子。但现在这已经成了子论坛上的顶流主题。

因为现在我们已经能够使用高性能推理模型和极其巨大的上下文窗口,而这也意味着单项任务可能一下子花掉好多钱——比如几十、几百美元。作为职位很高的资深开发者,也许这钱不算多,但对普通用户这肯定是笔不小的开支。甚至很多简单开发项目能赚到的钱还不如这里花掉的多。

这就是个巨大的转变。以往的软件开发只需要一台笔记本电脑和一根网线,余下的就是人员成本。但现在情况似乎已经改变了,软件开发能力开始成为一种基础设施成本,工程师们需要持续不断的 token 供应、否则就没法维持自己的工作效率。我不敢说未来的开发跟 token 消费到底有多大关系,但肯定是有的。我见过很多优秀的工程师,他们也是公司里烧钱最狠的岗位,但效率还是很高。从效果来看,这可能会让总体产出更高、可能会让开发者的工作体验更愉悦,但一定会改变整个行业。

Yoko Li :你提到“氛围编程”让定制化开发变得更容易。这会给软件与用户间的关系带来怎样的改变? 

Guido Appenzeller: 确实,我觉得软件的定制化程度会更高。毕竟任何企业总会有自己的定制化工具,比如说人力资源软件,公版软件能涵盖每家公司 0% 的需求。至于余下的 20%,我就曾经做过这类企业软件的项目经理,这也是最难搞定的部分。我们构建 API,再由内部团队构建相应的版本。比如我们构建了基础层,内部团队构建下一层,之后他们遇到问题,又把开发流程交回给我们。

现在有了氛围编程,我觉得定制比以往任何时候都更容易了,甚至可以可以由业务团队直接使用商用 API 来构建这个定制化层。

这就像之前曾经出现过 Zapier 和 RPA 工具,现在有了氛围编程,但我们还是要对代码有一定了解才能使用。这就带来了新的问题:如何才能让非技术人员掌握代码生成能力,借此实现自己的工作目标。甚至更大胆一点,我期待出现那种能够自我扩展的软件,用户只需要编写提示词就能添加额外功能。这认为这会是一种新趋势,微软 Word 的下个版本或者再下几个版本,也许在帮助菜单中就会提供“添加功能”按钮。假设我是一家营销公司的负责人,我想发布一项功能,让人们可以直观查看 6 Sigma 图表。这时候我就会跟大模型聊天会话,让它获取我的数据,然后由它生成代码来实现这项功能。所以不仅仅是 6 Sigma 图表,而是更多人们需要查看的内容。

在这种情况下,营销软件的最终用户与大模型间的交互模式就改变了,他们可以用自然语言来实现新的功能,这跟以往软件团队逐一发布功能的方式截然不同。

Yoko Li :鉴于以上这么多变化,在 AI 开发的新时代,到底有哪些值得把握的初创机会? 

Guido Appenzeller: 这个问题的实质,应该可以理解为这个世界还需要什么?那需要的可太多了。但有两件事我很确定。

第一,我认为纵观过去三、四十年间,现在可能是创办开发类初创公司的最佳时机。面对如此巨大的颠覆,初创公司真的有可能发展壮大,并最终与行业巨大展开竞争。我们肯定已经看到了一些端倪,比如 GitHub Copilot 就是微软旗下的成果,微软也是目前市场排名第一的 AI 服务厂商。可哪怕他们掌握着排名第一的源代码库、头号 IDE 和最优秀的企业销售团队,市场上还是涌现了一大批竞争对手,而且这些后起之秀的表现也相当出色。

第二点,我百分之百砍的是,好的想法并非来自风险投资者,而是创业者。只要发现一个能靠 AI 做得更好的机遇,那就有机会创造价值。当然,成功创业的关键在于快速执行和组建一支优秀的团队。但我的预测是,未来我们将会在这个领域投资数十家公司,也很期待能为下一波创业公司提供资金。

如果要聊更具体的创意,我可以大致提两个方向。第一是,我们可以重塑哪些传统工作流程,或者把已经存在的解决方案跟 AI 功能结合起来。另外一种则是创造出以往从未存在的事物,比如说以往的产品都是为人类创作的,那现在我们可以尝试为智能体创建产品,把智能体当成客户。

智能体显然需要更好的上下文,那就值得为此构建产品。要不要想办法让智能体查询大模型的延迟更低?当然,所以有些公司就在提供代码应用模型,其运行速度更快、准确率更高。在研究智能体还难以落地的场景时,就会发现还有很多工作要做。除此之外,还有很多重新发明智能体的可行途径。只要把思路转换一下,把智能体当作自己的客户,就可以为其重构经典基础设施。总而言之,我觉得当下就是创办企业的理想时机。

参考链接:https://www.youtube.com/watch?v=VlOAWvvjThU

简体中文 English