巨头们的 6000 亿美元 CapEx 并非全为了今年的芯片,而是在为 2028-2029 年的算力霸权预支付"门票"。
在算力受限的当下,H100 等芯片因其带来的推理收益,价值不降反升,颠覆了半导体行业的折旧常识。
全球 AI 算力的天花板最终取决于 ASML 能生产多少台 EUV 光刻机,这是 AGI 时间表的物理锁。
从 Hopper 到 Blackwell,真正的跨越是 NVLink 带来的全互联能力,而非单纯的 Flops 提升。
HBM 的低效率导致消费电子面临严重成本上涨,AI 可能引发第一波社会层面的负面情绪。
AI 的扩张正迫使资本主义从虚拟的比特世界回归到真实的原子世界,能源和精密制造是关键。
巨头们的万亿 CapEx(资本支出)并非全为了今年的芯片,而是在为 2028-2029 年的算力霸权预支付"门票"。
亚马逊、谷歌、微软和 Meta 今年的合计 CapEx 预测高达 6000 亿美元。Dylan 指出,这笔钱并非全部转化为当下的算力,很大一部分用于涡轮机定金、2027 年的数据中心建设以及长期电力采购协议。
OpenAI 采取了极具侵略性的"疯狂签约"模式,甚至与从未建过数据中心的软银能源合作;而 Anthropic 此前由于担心破产,在算力获取上过于保守,导致其在营收激增时面临严重的推理算力短缺,不得不接受更高昂的转售价格或收入分成模式。
不同于传统的贬值逻辑,在算力受限的当下,H100 等芯片因其带来的推理收益,价值不降反升。
传统观点认为 GPU 寿命为 3-5 年,但 Dylan 认为,如果 AI 带来的收益(如 GPT-5.4 带来的推理效率提升)远超芯片成本,那么即使是老一代芯片(如 A100)也可能因算力总量不足而被重新启用。
如果算力的固定成本(电费、运维)增加,用户会更倾向于购买高质量模型(如 Claude Opus 而非 Sonnet),因为相对溢价缩小了。
利润正从模型层向上传导至云厂商,再传导至 Nvidia,最后锁定在内存供应商(SK Hynix)和设备厂商(ASML)。
由于信息不对称,谷歌曾将自家的 TPU 容量贱卖给 Anthropic,随后在 Gemini 爆发后发现自己陷入了算力短缺的窘境。
谷歌直到去年底才真正意识到推理收入的增长潜力,随后开始疯狂抢占电力土地和涡轮机资源。
瓶颈在不断转换——从两年前的 CoWoS 封装,到去年的电力,到今年的 HBM 内存,最终在 2030 年将回归到最底层的半导体制造设备。
Dylan 描述了供应链的链式反应,从 PCB 供应商(如中国的沪士电子)到晶圆厂,每一个环节都在被 AGI 叙事疯狂动员。
全球 AI 算力的天花板最终取决于 ASML 能生产多少台 EUV 光刻机。
一台 EUV 机器售价 3-4 亿美元。目前 ASML 每年只能产出 60-70 台,到 2030 年即便全力扩张也仅能达到 100 台左右。
部署 1GW 的数据中心算力大约需要 3.5 台 EUV 机器的支持。这意味着 Sam Altman 想要的"每周增加 1GW 算力"在制造端面临巨大的物理约束。
Dylan 详细描述了 EUV 内部锡滴被激光击中产生 13.5nm 光脉冲的过程,以及 Carl Zeiss 制造的纳米级精度镜片,这些设备无法通过增加投资在短期内迅速倍增。
芯片的代际提升不仅在于 Flops(浮点运算数),更在于节点间通讯带宽(Scale-up)的质变。
很多人只看计算力翻倍,但忽略了推理模型需要在数百个芯片间拆分。从 Hopper 到 Blackwell,真正的跨越是 NVLink 带来的全互联能力,使得 72 块 GPU 能像一块芯片一样工作。
片上通信是 TB 级的,机柜内是数百 GB 级的,跨机柜则骤降。Blackwell 极大地拓宽了这个瓶颈,使某些推理任务的实际表现提升了 20 倍。
虽然可以用旧制程(如 7nm)堆叠,但在功耗和通讯效率上会全面溃败给 3nm 制程的 Reuben。
短期看好美国的高端算力优势,长期需警惕中国在半导体供应链上的全面自主化与规模优势。
如果 AI 发展飞快(Fast Takeoff),美国将利用现有的先进制程和万亿 CapEx 优势拉开距离;如果发展缓慢(Slow Takeoff),中国将有足够时间通过国产 DUV 和逐步攻克的 EUV 实现全产业链垂直化。
美国巨头正透支自由现金流投入 AI,如果回报率不及预期,华尔街将撤资;而中国则是基于战略生存的投入,这种韧性在长周期内极具威慑力。
HBM(高带宽内存)的生产效率极低,导致消费电子(手机、电脑)将面临严重的成本上涨和性能停滞。
HBM 的晶圆利用效率比普通 DRAM 低 3-4 倍。为了给 AI 提供内存,全球内存产线正从手机、电脑端抽离。
Dylan 预测,由于内存和闪存价格翻倍,低端智能手机的出货量可能减半,iPhone 等高端手机的物料成本(BOM)将增加 150-250 美元。
不要迷信国家电网,AI 巨头正在利用轮船引擎、燃料电池和燃气轮机实现"表后(Behind the meter)"独立供电。
由于电网并网许可需要数年,巨头们开始购买航空发动机(由 Boom Supersonic 等公司改装)、船用柴油发动机甚至是 Bloom Energy 的燃料电池。
即使有了芯片,人类还需要 40 万名电工和施工人员来完成算力的最后交付。模块化机房(将两兆瓦的算力单元像乐高一样集成在亚洲工厂)是降低现场劳动力的关键。
马斯克的太空算力愿景在 2030 年前不具备经济可行性,主要受限于故障率和部署周期。
GPU 价值最高的时期是其出厂后的前 6 个月。如果为了"免费能源"将芯片运往太空,涉及的测试、拆解、发射和重新组装将消耗 10% 的生命周期价值。
Blackwell 芯片的 RMA(退货授权)比例已达 15%,在太空这种无法通过"插拔"解决故障的环境中,算力集群的维护成本将是灾难性的。
参数量不是越大越好,由于硬件通讯限制,实验室正倾向于"更小、更聪明、RL(强化学习)更充分"的模型。
更小的模型推理更快,能让研究员更快地得到反馈,从而优化出更好的算法。这种算法效率的提升(每年约 10 倍)远超硬件堆叠。
如果台湾发生意外,全球 GDP 不仅是放缓,而是大规模萎缩,届时人类增加算力的能力将几乎归零。
算力竞赛的本质是物理供应链的竞赛。ASML 的产能和 HBM 的良率比任何算法优化都更直接地决定了 AGI 的上线日期。
关注半导体设备(ASML、Applied Materials)和电力基础设施(涡轮机、模块化电力),这些是"卖水人"中的卖水人。
未来两年,由于 AI 的资源挤占,普通消费者购买电子产品的成本将显著上升,AI 可能面临第一波社会层面的负面情绪。
AI 的扩张正迫使资本主义从虚拟的比特世界回归到真实的原子世界,谁能掌握能源和极端精密制造,谁就握住了通往 AGI 的钥匙。