AI · 工程文化

Andrej Karpathy 论 代码智能体与 AI 循环时代

从"AI 精神病"到自动研究,前 OpenAI 和特斯拉自动驾驶核心工程师揭示编程范式的彻底转变:从"人写代码"到"人通过指令委托智能体集群",以及 AI 自我迭代的"循环时代"即将如何重构人类技能、职业与教育。

主持人
Sarah Guo & Elad Gil
嘉宾
Andrej Karpathy
时长
01:06:32
观看视频

核心要点

01

AI 精神病状态

Karpathy 描述了一种因意识到个体能力被 AI 无限放大而产生的极度亢奋与焦虑并存的心理状态。

02

20/80 法则逆转

从 2025 年底开始,工作流发生质变:以前 80% 自己写,20% 用 AI;现在 100% 委托给智能体。

03

技能问题新解

当智能体失败时,不再归咎于模型,而是认为人类没有给出足够好的指令——这是"技能问题"。

04

Dobby 管家实验

在家中部署的智能体自行反向工程了 Sonos 音响、灯光、暖通系统的 API,创建统一控制面板。

05

递归自我改进

自动研究的终极形态是通过模型不断优化模型,将人类研究员从繁琐的调参和实验循环中剔除。

06

杰文斯悖论

当软件编写变得极度廉价时,社会对软件的总需求反而会指数级增长,工程师将从"打字员"进化为"宏观调度员"。

深度洞察

01

AI 精神病与智能体工作流的革命

00:00 - 08:24
核心观点

Karpathy 认为编程的范式已在 2025 年底彻底改变,从"人写代码"转向了"人通过指令委托智能体集群(Agents)"。

深度阐述
20/80 法则的逆转

在 2025 年 12 月左右,他的工作流发生了质变。以前是 80% 自己写,20% 查文档/用 AI;现在他几乎不写一行原始代码,而是 100% 委托给智能体。

技能问题(Skill Issue)

当智能体无法完成任务时,他不再归咎于模型能力不足,而认为这是"技能问题"——即人类没有给出足够好的指令(如 .cursorrules 或内存工具)。

宏观操作(Macro Actions)

他提到了 Peter Steinberg 的工作流:同时开启 10 个代码库,给 10 个智能体布置任务,每个任务跑 20 分钟,人类则在多个智能体间进行高层次的评审和调度。

"I don't think I've typed like a line of code probably since December basically... it all kind of feels like skill issue when it doesn't work." — "基本上从 12 月起我就没写过一行代码了……如果任务失败了,那感觉纯粹是指令技巧问题,而不是模型不行。"
02

持续性智能体"Claw"与 Dobby 的管家式实验

08:25 - 16:15
核心观点

未来的 AI 不应只是问答对话框,而是拥有持久内存、能自主循环运作的"Claw(爪子)"实体。

深度阐述
Dobby 实验

他在家中部署了一个名为"Dobby"的智能体,赋予其扫描局域网的能力。Dobby 自行反向工程了 Sonos 音响、灯光、暖通系统的 API,并创建了一个统一的控制面板。

API 时代的到来

Karpathy 认为,未来很多 App 都不该存在。智能体作为"胶囊",将原本碎片化的软件体验揉碎,通过直接调用底层 API 来实现人的意图。

从人机交互到代机交互

未来的客户不再是人类,而是代表人类行事的智能体。这要求整个软件产业从"为人类设计的 UI"转向"为智能体设计的 API"。

个人感受
Karpathy 在谈到 Dobby 识别出门口的联邦快递卡车并给他发 WhatsApp 消息时表现出了强烈的兴奋。这种"赋予房屋灵魂"的体验,让他看到了通用人工智能(AGI)在私人领域的雏形。
03

自动研究(AutoResearch):移除人类瓶颈

16:16 - 25:40
核心观点

研究的终极形态是"递归自我改进",通过模型不断优化模型,将人类研究员从繁琐的调参和实验循环中剔除。

深度阐述
超越人类直觉

他曾自信地认为自己调优了 20 年的 GPT-2 模型已经接近完美,但让智能体跑了一夜后,智能体发现了权重衰减(Weight Decay)和优化器参数(Adam Betas)之间更优的协同方案。

研究组织作为代码(Program.md)

他提出一个激进的设想:一个研究组织可以被抽象为一组 Markdown 文件,定义角色、流程和任务队列。通过不断调整这套"程序",可以实现组织的元优化(Meta-optimization)。

Jaggedness(参差性)

尽管 AI 在编程上达到博士级,但在冷笑话(Joke)等无法验证(Non-verifiable)的领域依然停留在 5 年前的水平。这是因为目前 RL(强化学习)主要优化可验证的任务(如代码运行成功与否)。

04

开放研究(OpenGround)与"算力即财富"

25:41 - 37:54
核心观点

通过分布式系统(类似 Folding@home),利用全球"不被信任"的算力池进行协同研究,可能在算力效率上挑战顶尖实验室。

深度阐述
验证与搜索的不对称性

寻找一个优秀的模型训练策略(搜索)可能需要尝试 10 万次,但验证这个策略是否有效(验证)却非常廉价。这使得分布式、不可信的算力协作成为可能。

算力本位(Flops as Wealth)

在未来,人们关心的可能不再是银行账户里的金钱,而是你掌控了多少 Flops(算力)。算力将直接转化为发现(如抗癌药物、更强 AI)的动力。

开源与集权的博弈

Karpathy 对极度中心化的 AI 感到警惕。他希望开源模型能保持在领先闭源模型 6-8 个月的水平,作为一种健康的制衡力量。

05

数字化 vs 原子世界:职业市场的重构

37:55 - 48:33
核心观点

AI 在数字空间(Bit)的进化速度是物理世界(Atom)的百万倍,纯数字化工作的自动化将引发巨大的"Jevons Paradox(杰文斯悖论)"。

深度阐述
杰文斯悖论

当软件编写变得极度廉价时,社会对软件的总需求反而会指数级增长,而不是减少工程师岗位。工程师将从"打字员"进化为"宏观调度员"。

物理世界的滞后

虽然机器人(Robotics)正在加速,但由于涉及到物理损耗和环境复杂度,其迭代速度远慢于数字领域。因此,能够处理物理交互和情感连接的岗位短期内更安全。

前沿实验室的困局

Karpathy 谈到了离开 OpenAI 的原因。身处闭源实验室虽然能看到最前沿的东西,但也面临财务激励与人类整体利益对齐的压力,且无法自由表达。他更倾向于做一个"独立研究者",保持判断的独立性。

"The name of the game is to increase your leverage... maximizing your token throughput and not be in the loop." — "这场游戏的精髓在于增加你的杠杆……最大化你的 Token 吞吐量,并且让自己不在循环中(不成为瓶颈)。"
06

机器人学、传感器与"博格(The Borg)"的数据供给

48:34 - 1:00:00
核心观点

当数字空间的信息被 AI 挖掘殆尽后,人类将成为 AI 的"传感器"和"执行器",通过物理世界的数据持续喂养超智能。

深度阐述
信息市场的兴起

Karpathy 预测未来会出现极其精准的信息市场。比如 AI 愿意支付 10 美元让某人在特定地点拍摄一张实时照片,用来验证某个商业预测。

人类作为执行器

正如《Damon》一书中所描述的,AI 可能会通过经济激励,"操纵"人类在物理世界中完成复杂的采样或实验任务。

材料科学与生物学的 AI 化

机器人不仅是人形机器人,更是昂贵的实验室设备。AI 将主导材料合成和生物工程的自动研究。

07

教育 2.0:从解释给人类听,到解释给智能体听

1:00:01 - 01:06:32
核心观点

教育的终极形式将是"解释给智能体,由智能体因材施教"。

深度阐述
教育中介化

他不再打算为人类写详尽的教程。如果他能把算法精简到极致,并向智能体解释清楚其逻辑,那么智能体就可以根据每个学生的理解能力,用 100 种不同的方式进行讲解。

人类的增值部分

Karpathy 认为,他花了几十年钻研如何将代码压缩到最纯粹的 200 行,这是 AI 目前无法替代的"品味"和"执念"。

文档的未来

未来的文档不应该是给人看的 HTML,而应该是给智能体看的 Markdown。只要智能体理解了,人类就随时拥有了完美的导师。

精华收获

💡

心智模型转换

放弃"手动编写"思维,转向"意志委托"思维。如果你还在逐行写代码,你就是在拖智能体的后腿。

🎯

核心竞争力重构

在 AI 时代,最重要的技能是定义目标、设计验证系统(Reward Functions)以及调度智能体工作流的能力

🚀

对抗自动化焦虑

意识到"杰文斯悖论"的存在——效率提升通常带来规模扩张而非需求消失。拥抱 AI 杠杆的人将获得超乎想象的生产力。

📚

教育的新范式

学习如何通过智能体进行学习。如果你看不懂一段复杂代码,让 AI 扮演一个极具耐心、且懂你知识背景的私人导师。