马斯克的巨型晶圆厂,靠谱吗?
来源:36kr 7 小时前

3月14日,埃隆·马斯克在X上发布了一行字。

“Terafab项目将于7天后启动。”

在与很多半导体从业者聊到我Terafab时,大家的反应几乎一致。“哈哈。”

之所以叫Terafab,是因为他们比千兆工厂还大,所以叫“tera”。逻辑电路、存储器和封装都在同一屋檐下。每年生产数千亿颗芯片。而且据说他想一边在工厂里抽雪茄吃芝士汉堡,一边建造芯片。

在普通半导体工程师看来,Terafab纯属扯淡。至少像我这样的普通半导体工程师是这么认为的。但话说回来,埃隆一直就是这样的人。他解决了那些领域专家认为无法解决的问题。

火箭。电动汽车。卫星互联网。每一次都是如此。然而,我还是忍不住想知道埃隆究竟会如何实现这个目标。

为此,在本文中我们将主要探讨两方面内容。首先,从一位曾在晶圆代工厂工作过的人的角度出发,阐述运营一家半导体晶圆厂为何如此艰难。其次,解释为什么“雪茄”这个比喻会引来业界的嘲笑。最后,解释2nm工艺的真正含义。最后,阐述为什么良率问题并非砸钱就能解决的。

其次,Terafab的实际运作模式可能会如何?三星泰勒工厂已经开始的举措,英特尔的相关传闻,以及德克萨斯州那条已经开始搬迁设备的封装生产线,都值得关注。

强调一下,本文所有的观点,都是从普通工程师视角看的。

哪些是已确认的,哪些是设想

首先,让我们把已知事实和埃隆的设想区分开来。把它们混为一谈会蒙蔽判断。

已确认的事实:埃隆·马斯克在2025年11月的年度股东大会上首次公开提及Terafab,当时他表示“即使是晶圆代工厂最乐观的预测也无法满足我们的需求”。在2026年1月28日举行的2025年第四季度财报电话会议上,这一想法变得更加具体。埃隆表示,特斯拉需要在美国建造“一座规模非常大的晶圆厂,涵盖逻辑、存储和封装”,并警告称芯片供应紧张问题将在三到四年内出现。

特斯拉目前的芯片制造阵容也已确定。AI4 由三星制造。AI5 将在台积电和三星以“略有不同的版本”运行,因为这两家代工厂的工艺特性存在根本差异,因此软件设计为可在两者上运行。样片将于 2026 年推出,量产将于 2027 年进行。AI6 将采用三星的 2nm SF2 工艺,并通过 2025 年 7 月签署的价值 165 亿美元的长期协议锁定在三星位于德克萨斯州泰勒市的工厂,该协议有效期至 2033 年。AI6 的性能目标约为 AI5 的两倍,量产时间约为 2028 年年中。

埃隆曾直接表示,AI7及以后的芯片需要“不同的晶圆厂”或“更具冒险精神的方案”。业内普遍认为,他指的是Terafab。

接下来,文章的重点转向了埃隆·马斯克的愿景以及媒体的猜测。据报道,目标制程节点为2纳米,预计成本约为250亿美元,但特斯拉从未公布过详细的成本数据。从每月10万片晶圆到最终达到100万片的产能提升是基于埃隆·马斯克本人的说法。顺便一提,每月100万片晶圆大约相当于台积电目前月总产量的70%。而且这还是在单一工厂的产量。每年1000亿至2000亿片芯片的数字则来自埃隆·马斯克对特斯拉、xAI和SpaceX三家公司总需求的估算。

所谓“愿景”,不过是埃隆一贯的作风:设定最高目标。你不必完全相信他的话。但就目前已知的事实而言,特斯拉需要掌控自身芯片供应这一方向本身,逻辑上是合理的。

“我们将在洁净室里抽雪茄”:

这句话揭示了什么

如果要将半导体行业对 Terafab 的反应浓缩成一个瞬间,那就是关于洁净室的评论。

在 2026 年 1 月的一次 Moonshots 播客采访中,埃隆·马斯克说:“我认为最新的晶圆厂在洁净室的建造方式上是错误的。我打个赌,如果特斯拉建造一座 2 纳米晶圆厂,我们就能在里面吃芝士汉堡、抽雪茄了。”

他的逻辑是:如果在整个生产过程中,晶圆始终密封在充氮容器内,则无需将周围环境维持在 ISO 1 级洁净度。晶圆隔离才是关键,而非整栋建筑的洁净度。

为什么这件事会被嘲笑?

现代先进的晶圆厂运行在 ISO 1 至 2 级洁净室标准下。这意味着每立方米空气中大于 0.1 微米的颗粒少于 10 个。人类一次呼吸就会释放数百万个颗粒。一支雪茄呢?数十亿个颗粒,外加会腐蚀极紫外 (EUV) 镜面并破坏工艺化学的有机污染物。芝士汉堡上的油脂也是如此。这不是比喻,而是物理定律。

埃隆所描述的基于FOUP的晶圆隔离技术已经是标准做法。晶圆在晶圆厂内以密封的FOUP形式运输,这并非什么新鲜事。问题在于晶圆必须离开FOUP,例如装入光刻设备、进入蚀刻、沉积或CMP腔室时。在这些时刻,晶圆会暴露于周围环境中。而这段暴露时间窗口决定了晶圆的良率。

台积电斥资数十亿美元建造洁净室是有原因的。这并非出于无知或墨守成规,而是因为他们花费数十年时间,将环境污染数据与原子级缺陷密度关联起来。在2纳米工艺下,单个晶体管的厚度就相当于数十个原子。一次污染事件就足以毁掉整个芯片。

黄仁勋曾公开警告马斯克不要低估其中的难度。“先进的半导体制造极其困难。这不仅仅是建一座工厂那么简单。台积电所采用的工程技术、科学和技术都极其复杂。” 他甚至对记者表示,赶上台积电“几乎是不可能的”。

关于洁净室的言论之所以重要,不仅仅是因为它在技术上是错误的。它表明,埃隆要么尚未完全理解半导体制造的复杂性,要么故意过度简化以推销他的愿景。这两种情况都是问题。前者意味着他在执行过程中会遭遇严峻的现实考验。后者则意味着他给投资者设定了不切实际的期望。

一个在晶圆厂工作过的人,

为什么觉得 Terafab 不合理

无尘室只是个开始。

我(指代本文作者,下同)曾在三星晶圆代工厂、高通和AMD从事芯片后调试和良率提升工作。我亲眼见证了芯片在晶圆代工厂内外的整个制造过程。从这个角度来看,Terafab面临的挑战远不止一两个。

1. 建造工厂的实际操作

建造一座先进的晶圆厂并非建造一座普通的建筑物。Exyte公司在过去30年中建造了大约300座晶圆厂,该公司表示,一座大型先进晶圆厂需要3000万至4000万工时,8.3万吨钢材,9000公里电缆(比首尔到洛杉矶的距离还长),以及60万立方米混凝土。在晶圆厂内部,大约有4万平方米的洁净室,2000台工艺设备,每台设备平均有50个独立的公用设施和工艺连接。这意味着超过10万个管道、气体、电力和冷却液连接必须在同一设施内协同工作。

在台湾,建造这样规模的晶圆厂大约需要19个月。而在美国呢?需要38个月。时间是台湾的两倍,成本也几乎是台湾的两倍。而且这还是在一家拥有数十年晶圆厂建造经验的公司的情况下。美国建造速度较慢的原因在于:审批流程复杂,环境法规严格,考虑到劳动法规的限制,24小时不间断施工难以维持,而且拥有晶圆厂建造经验的工人数量稀少。Exyte公司的首席技术官赫伯特·布拉希茨表示,台湾的建筑工人拥有丰富的晶圆厂建造经验,即使没有详细图纸也能进行施工。而美国则缺乏这种经验储备。

台积电亚利桑那州Fab 21晶圆厂就是一个真实的案例。该项目于2020年宣布,2021年破土动工,原定于2024年投产,但由于劳动力和供应链问题而推迟。三星泰勒晶圆厂也因客户不足和设备交付问题而延误。这些都是拥有数十年晶圆厂建设经验的公司所面临的困境。而特斯拉从未建造过晶圆厂。

2. 2纳米工艺的技术复杂性

“2nm”不仅仅是缩小电路尺寸,晶体管架构本身也发生了改变。

FinFET,这种业界沿用多年的3D晶体管结构,在3nm工艺节点上已达到极限。到了2nm,就必须转向环栅(Gate-All-Around,GAA)技术,特别是纳米片结构。FinFET将栅极环绕在沟道的三个侧面,而GAA则环绕所有四个侧面。这是自平面晶体管过渡到FinFET以来最大的架构变革。虽然可以复用许多工艺模块,但纳米片堆叠均匀性的控制、钌互连和高介电常数栅极介质等新材料,以及减材金属化等技术,都需要从零开始研发。

数据:IBS估计,一座每月生产5万片晶圆的2纳米晶圆厂的建设成本约为280亿美元。这比一座3纳米晶圆厂的200亿美元高出约40%。每片2纳米晶圆的制造成本约为3万美元,比3纳米晶圆高出约50%。成本增加的很大一部分来自额外的EUV光刻层。2纳米晶圆的流片成本约为1亿美元。一个糟糕的设计决策,就可能损失1亿美元。

3. 良率:最残酷的部分

这才是真正的问题所在。

在2纳米工艺下,每平方毫米的面积上要集成超过3亿个晶体管。晶圆要经过数百道工序。如果其中任何一道工序的缺陷密度超出规格,良率就会骤降。要控制这种情况,需要将计量、检测和工艺控制整合为一个统一的系统。

英特尔 18A 就是一个相关的案例。该工艺于 2025 年 10 月开始量产。英特尔的首席财务官也承认,要到 2026 年底才能达到“盈利良率水平”。一家拥有 50 多年经验的公司,在新制程节点上控制良率竟然需要一年多的时间。三星晶圆代工的 3nm GAA 工艺则是一个更惨痛的例子。他们率先将 GAA 工艺推向市场并实现量产,但与台积电相比,良率差距巨大,这使得他们很难赢得大客户。抢占先机并不意味着就一定好。

特斯拉从2纳米工艺起步,从一开始就保证良率?我从事过良率提升方面的工作,我认为这几乎是不可能的。

4. 设备:资金无法解决的瓶颈

全球只有一家公司生产极紫外光刻扫描仪:ASML。下一代高数值孔径(0.55NA)极紫外光刻扫描仪单价高达3.5亿至4亿美元。英特尔已为其14A工艺节点预定了首批十台高数值孔径极紫外光刻扫描仪。如果特斯拉今天下单,最早也要到2028年才能交付。除了极紫外光刻扫描仪之外,晶圆厂还需要数百种其他类型的设备,涵盖沉积、蚀刻、化学机械抛光(CMP)和计量等领域,每种设备的交付周期从六个月到两年不等。

劳动力短缺问题与设备短缺问题如出一辙。SEMI预测,到2030年,仅在美国就有超过6万个半导体行业职位空缺。英特尔、台积电和三星都在同时建设美国晶圆厂,如果特斯拉也加入竞争,人才短缺问题将更加严峻。

5. 没有设计生态系统:没有PDK

仅仅建造晶圆厂并不足以制造芯片。你还需要PDK,即工艺设计套件。这意味着晶体管模型、设计规则、标准单元库、I/O库、内存编译器等等。台积电、三星和英特尔都花费了数十年时间开发各自的PDK。开发适用于新制程节点的PDK并获得EDA工具认证本身就需要一到两年的时间。如果特斯拉运营自己的晶圆厂,则必须从零开始构建PDK。

特斯拉是否有足够的人才来做到这一点?吉姆·凯勒于2018年离职。彼得·班农在2025年Dojo项目关闭时也离开了。加内什·文卡塔拉马南于2023年离职创立了DensityAI。目前,特斯拉在定制芯片领域的领导地位存在着明显的缺口。

6. 逻辑与记忆的结合?垂直整合的复杂性

逻辑芯片和存储器芯片的制造工艺本质上截然不同。它们使用不同的材料、不同的设备,以及不同的污染控制标准。逻辑芯片晶圆厂使用铜作为金属互连线,而DRAM则依赖于钨和钼。在共用的洁净室中,这些材料之间的交叉污染会严重影响良率。三星同时生产逻辑芯片和存储器芯片,但它们分别在不同的晶圆厂生产,由不同的机构运营,采用不同的工艺流程。将它们合并在同一屋檐下,则面临着完全不同的问题。

为什么你不能完全否定埃隆·马斯克?

以上就是普通工程师对 Terafab 的看法。

但正如我开头所说,埃隆整个职业生涯都听到过类似的质疑。重要的是,业界“这行不通”的论断已被反复证明是错误的。

首先看SpaceX。2002年,一位没有任何航空航天背景的人宣布要制造火箭。猎鹰1号的前三次发射均告失败。当公司仅剩下足够进行最后一次尝试的资金时,第四次发射成功了。埃隆·马斯克本人曾表示,他当时只认为成功率只有10%。如今,SpaceX已成为全球最大的商业发射服务提供商,每隔几天就会发射一次火箭。

特斯拉在2008年几乎破产。Model 3的生产陷入了“生产地狱”。每个季度都有破产传闻流出。但他还是坚持了下来。

超级工厂,星链,这两个项目起初都饱受质疑。但最终让他成功完成的,是他执着运用的一套特定的问题解决框架。

埃隆的五步算法应用于 Terafab

埃隆·马斯克在他的传记中运用了沃尔特·艾萨克森称之为“算法”的五步问题解决框架,他将其应用于SpaceX和特斯拉的制造流程中。以下是它如何应用于Terafab项目。

第一步:质疑每一项要求。“为什么整个洁净室都需要达到 ISO 1 级?” 用雪茄来举例可能过于简单化,但对台积电 37 年来一直习以为常的事情提出“为什么?”正是这一步的关键所在。

第二步:删除。“最好的部分就是没有部分。”半导体制造工艺的各个步骤相互依存,因此与火箭制造相比,可删除的环节要少得多。但在晶圆厂建设过程中,很可能存在许多可以去除的低效环节。

第三步:简化和优化。“聪明的工程师最常犯的错误就是优化那些本不应该存在的东西。”特斯拉就曾花费大量精力在Model 3的生产过程中实现电池垫的自动化,后来才意识到电池垫本身是不必要的。

第四步:加速。“如果你在自掘坟墓,就不要挖得更快。”速度只有在前三步完成后才能实现。将美国工厂的建造周期从38个月缩短正是这一原则的体现。

第五步:自动化。“我工厂最大的错误就是从一开始就试图实现每个步骤的自动化。”这是从Model 3生产困境中吸取的教训。Terafab不可能从一开始就成为一座完全自动化的2nm工厂。更现实的做法是先小规模生产,积累经验,然后再逐步扩大规模。

这五个步骤能否应用于半导体工艺本身?说实话,我仍然持怀疑态度。但我认为它们可以应用于晶圆厂的建设和运营。并非指工艺化学本身,而是指围绕这些工艺的基础设施、物流和建设方法。晶圆厂行业几乎肯定存在一些被奉为惯例的低效做法,而这很可能就是埃隆·马斯克着手改进的地方。

实际效果如何

最重要的问题不是“Terafab 是否会发生”,而是“如果它发生了,它会采取什么形式”。

一、三星泰勒:零步

这笔价值165亿美元的交易的真正意义不在于合同金额,而在于据报道埃隆·马斯克希望深入三星的生产线,直接参与提升效率的工作。这种权限对于一般的无晶圆厂客户来说是无法获得的。之所以能够达成这笔交易,是因为三星位于泰勒的晶圆厂当时大部分时间都处于闲置状态,没有固定的客户。

3月17日也有消息传来。三星正准备在泰勒园区建造第二座专门用于生产AI6芯片的晶圆厂。第一座耗资250亿美元的晶圆厂尚未投产,他们就已经开始建造第二座了。这表明特斯拉的芯片需求将超过单座晶圆厂的产能。据报道,泰勒园区最多可容纳十座晶圆厂。

我的理解是:特斯拉在三星泰勒公司积累的经验、工艺工程知识、良率改进方法、设备操作专业知识,是 Terafab 的零点。

二、封装:最确定的第一步

据 DigiTimes 报道,SpaceX 位于德克萨斯州的 FOPLP(扇出型面板级封装)生产线已于 2025 年 9 月开始接收设备。目标是在 2026 年第三季度实现小批量生产,并在 2027 年第一季度全面投产。该生产线最初用于 Starlink 卫星的射频芯片封装,但同样的基础设施可以直接扩展到特斯拉人工智能芯片的封装。

为什么封装如此重要?目前人工智能芯片市场最大的物理瓶颈是台积电的CoWoS封装产能。英伟达、AMD和博通都在争夺CoWoS的配额。如果特斯拉能够掌控自己的封装生产线,就能彻底摆脱这一瓶颈。此外,封装的准入门槛远低于晶圆制造。无需极紫外光刻技术,洁净室标准也更低。这才是两到三年内取得显著成果的最现实途径。

三、英特尔:大门敞开

就已确认的事实而言:埃隆·马斯克曾公开表示,他认为此事与英特尔有关。英特尔晶圆代工业务急需外部客户(预计2024年第四季度运营亏损22.6亿美元)。DigiTimes报道称,Dojo 3芯片的封装可能由英特尔位于亚利桑那州的工厂负责。如果消息属实,那么双方已经建立了合作关系。

以下纯属推测。特斯拉全面收购英特尔并不现实。但长期租赁英特尔晶圆厂的特定生产线、成立合资企业进行共同投资,或者建立庞大的先进封装客户关系,这些都是可行的方案。英特尔首席执行官陈立步曾公开承认,“没有外部客户,14A封装技术就无法推进”。特斯拉是极少数拥有足够规模来支撑这一论点的公司之一。

电池日带来的启示:

真正的目标是杠杆作用

在2020年的电池日活动上,埃隆·马斯克宣布特斯拉已实现4680电池的自主生产。尽管2022年实现100GWh产能的目标未能如期实现,但最终还是取得了成功。在此过程中,特斯拉也因此在与松下和宁德时代谈判时获得了更大的优势。虽然这并非完全的独立生产,但“我们可以自己生产”这一选择的存在,彻底改变了谈判的格局。

Terafab 的模式可能也类似。其最终目标并非“100% 自产芯片”,而是“我们不再受制于芯片供应”。宣布建设晶圆厂本身就是一张与台积电和三星谈判的王牌。即便在晶圆厂正式投产之前,这张牌就已经奏效了。

在胡说八道和远见之间

我是一名半导体工程师,曾在三星、高通和AMD工作过。我亲眼见证了芯片的设计、制造、测试和量产过程。我在这个领域拥有足够的经验,可以比较有说服力地谈谈半导体制造究竟有多难。

所以,就我目前对Terafab的描述来看,我认为其愿景与现实之间存在巨大差距。单就“雪茄”这个比喻而言,听起来像是某人对半导体制造的本质缺乏全面了解。

与此同时,我认为特斯拉的半导体内部化进程将会以某种形式继续推进。其内部对半导体的需求规模巨大(例如FSD、Cybercab、Optimus、xAI等)。制造合作伙伴多元化进程已经启动。与三星泰勒合作开展的代工学习项目也已初见成效。位于德克萨斯州的FOPLP生产线也已投入实际生产。最重要的是,埃隆·马斯克过往的卓越业绩以及特斯拉的算法都将为特斯拉的未来发展奠定基础。

Terafab 在很多人眼里看起来像个骗局,这很正常。SpaceX是这么过来的,特斯拉是这么过来的,星链也是这么过来的。

简体中文 English