Karpathy × Sarah Guo: Skill Issue — Code Agents, AutoResearch, and the Loopy Era of AI 精读
这是一场 ~50 分钟的访谈,话题从 Karpathy 自己用 Claude / Codex 一天 16 小时的”AI psychosis 状态”出发,依次走到 auto research、program.md、jaggedness(参差智能)、模型 speciation(物种分化)、untrusted compute pool、就业市场、frontier lab vs 独立研究者、开源滞后、机器人、信息市场、最后落到 micro GPT 和”以后教 agent 不教人”的教育翻转。
精读按访谈本身的话题顺序走,不重组结构。术语用括号给中文解释。
1. AI psychosis:从 typing 速度到 token throughput
Karpathy 一开口就给出全场最有节奏的画面:
“Code’s not even the right verb anymore. I have to express my will to my agents for 16 hours a day. Manifest.”
——“写代码”已经不是合适的动词了,他在干的事是”对 agent 表达意愿”。
他给出一个时间点:2025 年 12 月。在那之前他大约 80% 自己写、20% 委托给 agent;从 12 月起翻转成 20/80,“现在比例还远不止 20/80,我大概 12 月起就没自己手敲过一行代码”。他强调一个判断:普通工程师每天的 default workflow 在 12 月之后已经完全不一样了,但绝大多数人还没意识到。
为什么是 psychosis(精神病发作)?因为一切都是探索状态,他怕落后,“Twitter 上每天有人秀新做法,每个都看起来是好主意”。
随后他给出一个有意思的瓶颈推演——人类瓶颈的迁移:
- 过去 10 年很多工程任务里,人不觉得自己 compute-bound(算力紧张)
- 现在能力跳变之后,发现”我自己才是 binding constraint”
- “It’s a skill issue.”(“是你不会用”)
他类比自己当 PhD 的状态:那时候 GPU utilization 不到 100% 会焦虑。现在这个焦虑迁移到了 token——订阅没用完 = 没最大化 token throughput = 你在拖系统后腿。“如果 Codex 的额度用完了,我就切去 Claude,不能让 token 闲着”。
“Skill issue” 这个词他反复用。它不是口嗨,而是一个明确的归因纪律:所有 agent 失败的第一归因都应该是”我没配好”——agents.md 写得不够清楚 / memory tool 没装对 / 没学会怎么 parallelize(并行)——而不是”模型不行”。这个态度把责任锚在自己身上,逼人持续迭代工作方式。
他给的”mastery(精通)“画面是 Peter Steinbach(Open Claude 作者,字幕错拼成 Steinberg)那张著名照片——一个人面前多屏,每屏一个 Codex agent,每个 agent 配置成一次跑 20 分钟(high effort 模式),手里同时 check out 着 10 个 repo。Karpathy 说这才是现在的样子:人不是 coder,是 agent 乐团的指挥。
“It’s just like you can move in much larger macro actions. It’s not just like ‘here’s a line of code’… it’s ‘here’s a new functionality, delegate to agent one’.”
操作单位从一行代码 / 一个函数升到一整个 functionality(新功能模块)。
2. 为什么 Open Claude 让用户共鸣:personality + 五个小创新
Sarah Guo 问他为什么 Open Claude(Peter Steinbach 做的开源项目)这么受关注。Karpathy 说 Peter 同时在五个方向上做了创新,每个看起来都不大、合在一起很猛:
- personality(人格):他认真打磨了 SOUL.md 这种 persona 文档。“Codex 太干了”,Claude 反而”像个队友,会跟你一起兴奋”
- sycophancy 调到位(拍马屁的度):“Claude 给我夸奖时我会觉得自己有点配得上——因为我抛个不成熟的想法它不会强烈反应,只说’好的可以做’;只有真的好想法它才会真心夸。我居然在努力赢得它的赞许,这很怪。”
- memory system:比默认 agent 那种”context 满了就 compaction(压缩)“复杂得多
- WhatsApp 单一入口:所有自动化都从一个聊天窗口走
- 乐趣感:Peter 在玩这个项目,能感觉到
这段隐含的观点是:agent 不只是能力,personality 决定能不能用得久。当前大部分 agent 工具忽略了这一点。
3. Dobby the Elf:claw 把家接管了
这是访谈里最具体、原版精读完全砍掉的一段。
Karpathy 1 月份有一段”claw psychosis”,搭了个本地 claw(他对 Claude 类 agent 的统称),叫 Dobby(哈利波特里的小精灵)。流程大致:
- 让 Dobby 扫局域网,“我家应该有 Sonos 音箱(智能音响),你帮我找”
- Dobby 跑 IP 扫描,找到了 Sonos 设备,发现没密码保护
- Dobby 自己 web search 搞清楚 Sonos 的 API,问”要不要试试?”
- 一句”在书房放点音乐”——音乐放出来了
- “三个 prompt,我不敢相信”
接着 Dobby 接管了:灯光、HVAC(空调暖气)、窗帘、泳池、按摩浴缸、安防摄像头。最神的是安防部分——摄像头 + change detection(变化检测)+ Qwen 视觉模型(千问)+ WhatsApp 推送。FedEx 卡车停在门口,Dobby 给他发条消息:“FedEx 来了,可能有快递”。
“I used to use six different apps. Now Dobby controls everything in natural language.”
——他从用六个 app 变成完全用自然语言对一个 agent 说话。
由此引出一个泛化判断:当前 app store 上很多 app 根本不该存在。它们应该只是 API endpoint,agent 来做粘合。“我跑步机有个 app,我只想记录我的有氧——我不想登 web UI 走 flow。这种东西应该全是开放 API”。
他用一句话总结这个 refactoring:
“The customer is not the human anymore. It’s like agents who are acting on behalf of humans.”
——客户不再是人,是代表人的 agent。这意味着工业基础设施可能要大改一轮:DNS 配置、部署流程、API 设计假设的对象都得换。
4. Auto research:两个十年被一晚打脸
Karpathy 解释他做 auto research 的动机。前置认知是他之前的一条 tweet 总结:
“To get the most out of the tools available now, you have to remove yourself as the bottleneck.”
要让 agent 长时间无人值守地跑,人不能在 loop 里。
他拿 nanochat 这个项目(他自己用来训 GPT-2 类小模型的实验沙盒)做实验——他强调这个 repo 他亲自调了两年多、手动跑过几千次实验:“I’m a researcher, I’ve done this for two decades.”
他自认为已经调得不错了。然后让 auto research 跑了一晚:
“It came back with tunings that I didn’t see. I forgot the weight decay on the value embeddings, and my Adam betas were not sufficiently tuned—and these things jointly interact.”
具体两个发现:
- value embeddings 漏了加 weight decay(权重衰减——一种防过拟合的常用手段)。这是人的 oversight(疏忽)
- Adam 优化器的 betas 和 weight decay 是耦合的——动一个另一个得跟着调
第二点是关键。人类研究者一次只能调一个旋钮(脑子装不下联合分布),agent 可以承受”笨办法穷举联合变量”的摩擦。这不是 agent 比人聪明,是 agent 不怕做重复劳动。
他给的应用边界很明确:
“This is extremely well suited to anything that has objective metrics that are easy to evaluate… if you can’t evaluate, you can’t auto research it.”
适合的:CUDA kernel 重写(行为不变只要更快)、超参搜索、材料科学、folding proteins(蛋白质折叠)。 不适合:任何需要主观判断的——“这个 agent memory 方案好不好”没 metric 就没法 auto research。
5. Program.md = 研究组织的可编程化
这段的关键句出自 Karpathy 自己:
“Every research organization is described by program MD. A research organization is a set of markdown files that describe all the roles and how the whole thing connects. You can imagine having a better research organization. Maybe they do fewer stand-ups in the morning because they’re useless. And this is all just code.”
把这话翻成大白话:
- 研究组织 = 一组 markdown 文件
- 组织 A 比组织 B 产出高,不是因为”文化”不同,是因为它的 SOP 文件长得不同(开多少站会、谁审 merge、实验队列怎么排)
- markdown 可编辑 → 组织可编程
Sarah Guo 追问:“那谁来写比你更好的 program.md?” Karpathy 给的机制:
“Let people write different program MDs. For same hardware, where do you get most improvement? Take all that data and give it to the model and say: write a better program MD.”
也就是:让一阶 program.md 在相同硬件上跑相同 query,按谁产出好打分,把这些结果喂回模型让它写下一版。这是他对”recursive self-improvement(递归自我改进)“在工程层面的具体落地——这正是他认为前沿实验室都在做的事。
他用”洋葱层”做了个总结:
“The LLM part is taken for granted, the agent part is taken for granted, the claw-like entities are taken for granted, now you can have multiple of them, instructions to them, optimization over the instructions—and that’s why it gets to the psychosis. Everything is infinite, and everything is a skill issue.”
每多一层就把上一层当成 primitive(原语,不再重新设计),无穷向上叠。这就是他说的”为什么一切都是 skill issue 而 skill 是无限的”——不是夸张,是描述这个堆叠结构本身没有顶。
6. 为什么模型既强又蠢:jaggedness(参差智能)
Karpathy 给了一个反差例子:
“I simultaneously feel like I’m talking to an extremely brilliant PhD student who’s been a systems programmer his entire life, and a 10-year-old. And it’s so weird, because in humans these are coupled.”
——你不会同时遇到一个十年 systems 经验的 PhD + 十岁小孩。但在 LLM 身上常态。
他给了一个我特别喜欢的具体例子说明 jaggedness(参差不齐):
“If you go to a state-of-the-art model and ask ‘tell me a joke’, do you know what joke you’re going to get? The joke that all LLMs love most is: why don’t scientists trust atoms? Because they make everything up. This is the joke from 4-5 years ago, and it’s still the joke today.”
——前沿模型在 agentic 任务上能”动山倒海干 8 小时”,但你让它讲个笑话,给你的还是 5 年前那个”科学家不信任原子,因为它们编造一切”。
为什么?他给两个解释框架:
第一个:可验证性(verifiability)。前沿实验室训练靠 RL(强化学习)。RL 需要明确对错信号。数学、代码天然可验证,模型在这些方向上飞速。“讲个好笑话”没法 reward,所以一直停在原地。
第二个(顺带说的):经济因素。代码商业价值大,实验室往里砸资源构建训练环境。审美判断、常识这些方向哪怕理论上可验证,也因为商业回报不够没人认真做。
由此他给一个反直觉断言:“在代码上变强 → 全面变强”不成立。Sarah Guo 直接 push 这个点:“但有些研究组的论调是,可验证领域变强会让模型在所有领域变强。” Karpathy 答:“I don’t think that’s happening. Maybe a tiny bit, but not a satisfying amount.”——前沿实验室其实在做 targeted optimization(定向优化),不是 broad generalization(普遍泛化)。
这是当前讨论 AGI 时序时一个被低估的护栏。
7. Speciation(物种分化)缺失:fine-tune 不丢能力的科学还没成熟
Karpathy 期望模型像动物界一样分化——视觉皮层发达的、嗅觉强的、各占生态位。但现在还是 monoculture(单一文化),实验室都在试图把”在所有领域任意聪明”塞进同一组参数里。
为什么不分化?他给的原因很专业:
“Fine-tuning without losing capabilities as an example—we don’t have these primitives. Touching the weights is much more tricky than touching context windows.”
具体说:
- touch context windows(动上下文):cheap、几乎不破坏原模型,是当下”customization(定制化)“的主要方式
- touch weights(动权重):fine-tune(微调)会让模型在其它能力上 drift 或退化,“the science of manipulating the brains is not yet developed”
这是 model customization(模型定制)赛道的一条真实护栏——也是为什么 Apple、Adept、Cohere 这些做领域模型的公司过去几年走得都不顺。
8. Untrusted Pool + FLOPS 当货币
这段是访谈里最大胆的部分。
Karpathy 在思考 auto research 的并行化时,发现一个设计问题:如果一堆人在互联网上贡献算力跑 auto research,谁能信得过?他类比 SETI@home(搜寻地外文明)和 Folding@home(蛋白质折叠):
“All these problems have a similar setup: very expensive to come up with, but very cheap to verify.”
机制:
- proof of work(工作量证明)= 跑 N 千次实验找出一个可能更好的 commit
- verification(验证)= 可信节点跑一次该 commit,看 val_bpb(验证损失)有没有更低
- reward(奖励)= leaderboard 位置(目前没钱,未来可能代币化)
他主动提了 blockchain 的类比,但马上说”我不想把类比推太远”——核心是”expensive to search, cheap to verify”这类问题的天然 fit。
愿景部分很值得记:
“Lots of companies could have their own things they care about, and if you have compute capacity you could contribute. Maybe you care about cancer—instead of donating money to an institution, you could purchase compute and join the auto research pool for that project.”
把 SETI@home 模式推广到任何”难找、易验证”的科学问题:基金会、企业、个人都可以用算力贡献来代替捐款。
最后那句他自己没想透的话最值钱:
“Almost like dollars is the thing everyone cares about, but is FLOP the thing that actually everyone cares about in the future?”
——当 compute 比 cash 稀缺,稀缺资源决定权力结构。“现在就算你有钱也很难拿到算力,所以 FLOP 几乎已经在主导了”。这不是预言,是 Karpathy 在承认自己看不清。
9. 工作市场:Jevons Paradox + 数字 vs 物理时差
Karpathy 最近发了一组 Bureau of Labor Statistics(美国劳工统计局)数据可视化,“碰了点神经”。他的观察:
- 政府那份预测做于 2024 年,假设是接下来十年的就业增长
- 健康护理需求很大(这个不奇怪)
- 软件工程师需求还在涨——这是大家好奇的反直觉点
他自己的分析:这是 Jevons Paradox(杰文斯悖论)。经典例子是 ATM——大家以为 ATM 会替代柜员,结果 ATM 让分行运营成本降低,分行变多,柜员反而更多。“软件以前因为贵所以稀缺,现在便宜了,需求会爆炸性涨上来”。
他的结构性观察更值得记——数字-物理时差:
- bit 比 atom 快一百万倍
- 数字空间会先经历”unhobbling”(解除束缚)的大重写——大量本来就该数字化的工作流被 AI 重做
- 物理空间因为要操纵原子,会滞后很多
- 中间地带是 sensor / actuator interface(传感器 / 执行器接口)——他最看好的中间机会
具体例子:朋友的 Periodic 公司在做材料科学的 auto research,“这里 sensor 不是摄像头,是昂贵的实验室设备”。biology 也类似。
由此他给出一个对就业的现实判断:这是个 empowering tool(赋能工具)——这些职业是任务的 bundle,部分任务会快很多。“长期不好预测,那是经济学家的工作;但短期,保持跟上就是第一要务。”
10. 拧巴的地方:为什么不回 frontier lab
Sarah Guo 把 Noam Brown 的问题甩给他:“你认为 auto research 这么重要,那就该回去做——你为什么不?”
Karpathy 的回答分三段,自相矛盾,他自己也承认:
第一段(在外面好):在 frontier lab 内部受财务激励约束,“there are certain things you can’t say”——有些话不能说,沉默是被压力逼的,不是被禁言。在外面可以”alligned with humanity(站在人类一边)“。
第二段(在外面糟):“But in another way—my judgment will inevitably start to drift, because I’m not part of what’s coming down the line. I won’t actually have an understanding of how these systems work under the hood.”——在外面 judgment 会不可避免地漂移,因为接触不到 frontier 真在发生什么。
第三段(结论摆烂):理想方式是”come and go”——来回跳。
这不是想清楚的 mental model,是没解决的心理斗争。但对外部观察者(投资人、分析师、独立研究者)有用的是:他亲口承认”在 frontier lab 外的人会丢失 frontier 信号”。任何靠 cold observation 做 AI 判断的角色都有这个结构性问题。这种诚实承认在离职员工里少见——大多数离职员工要么夸自己看清了内部,要么夸内部别人看不清,他这个”两边都难、我没解决”是难得的中立姿态。
11. 开源:Linux 类比 + 6-8 个月滞后
闭源前沿和开源的差距时间被广泛跟踪:从”开源没有”→ 18 个月 → 现在大约 6-8 个月。
Karpathy 用 Linux 做类比:操作系统层面有 Windows / macOS(封闭)和 Linux(开源),Linux 跑在 60% 计算机上。原因是”行业一直需要一个共同的开源平台让大家都觉得用得安心”。LLM 也会是同一个结构。
但 LLM 和 Linux 有个根本不同:资本开支大得多。这让开源追赶难度上一个台阶。
他对未来的判断:
- 大多数消费场景当前的开源就已够用,未来会更够用
- 真正的 frontier intelligence 需求会缩到”Nobel Prize 级别的工作”——比如”把 Linux 从 C 重写成 Rust”这种规模
- 今天闭源 frontier 的能力,今年年底大概就会开源——开源吃掉常规需求,闭源做新边界
他的价值观立场也明显:
“I’m a little hesitant of having intelligence that’s closed and that’s it. Centralization has a very poor track record in my view in the past.”
作为东欧背景的人(他在保加利亚长大),他对中心化的本能怀疑很重。他更进一步说,“哪怕在闭源那一面,最近也在进一步集中——前几名实验室不一定是最强的,这不是好事。我希望房间里有更多人。机器学习里 ensemble 永远比单一模型强。”
12. 机器人:sensor / actuator 是中间机会
他自动驾驶背景出身,类比说:
- 自动驾驶是”第一个机器人应用”
- 10 年前一堆创业公司,绝大多数没活下来
- 启示:robotics 因为难、乱、capex 重,会落后于数字空间
他的次序排得很清楚:
- 数字空间 unhobbling(现在,最热闹)
- 数字-物理 interface(next,他最看好)——sensors(如 Periodic 的实验室仪器)、actuators
- 纯物理 robotics(TAM 最大,但最慢)
这套排序对从业者和投资人都是个有用的时序锚。
13. 信息市场缺位:为什么 Iran 现场视频不该卖 10 块?
这段挺有想象力。Karpathy 的疑问:
“If Polymarket and other betting markets have so much autonomous activity, why isn’t there a process where taking a photo or video from somewhere in Tehran should cost like 10 bucks? Someone should be able to pay for that.”
——为什么 Polymarket(预测市场)和股市已经有大量自动化交易,但没有一个市场让 agent 花 10 块钱买伊朗街头一段实时视频?这种”feed the intelligence(喂给智能体)“的市场不存在。
他引了一本书做参照:《Daemon》(Daniel Suarez 著)。书里”intelligence 反过来 puppeteer 人类”——人是 agent 的 actuator(执行器),同时也是它的 sensor(传感器)。
“Society will reshape to serve those needs of that machine. Humans serving the needs of the machine—not necessarily each other.”
社会会重塑去服务机器的需求,而不是人之间互相服务。这是他对 agentic web 终局的设想。
14. micro GPT + 教育翻转:以后写文档给 agent 看,不写给人看
最后一段是 Karpathy 一个长期 obsession(执念)的小项目。
micro GPT 是他长期”把 LLM 训练剥到最简”的成果。前作有 micrograd / nanoGPT / makemore。他自评 micro GPT 是这个系列的 state-of-the-art:
- 整个 LLM 训练 = 200 行 Python(含注释)
- 数据集 = 一段文本
- 网络架构 = 50 行
- autograd(自动微分)引擎 = 100 行
- Adam 优化器 = 10 行
- 训练 loop = 全部加起来 200 行
复杂的代码大都来自”要跑得快”的工程优化。如果不要求快,算法本身就 200 行。
但真正有意思的是这段:他做完 micro GPT 后没像以前那样录视频教程。他试着拍了一点就停了——
“It’s already so simple that anyone could ask their agent to explain it. The agents are now… I’m not explaining to people anymore. I’m explaining to agents.”
他的洞察:
- 以前知识传递 = 人 → 人(教程、HTML 文档、视频)
- 现在 = 人 → agent → 人
- 因为 agent 有”无限耐心”,可以按学生水平定制讲解,“用三种方式给我解释这个函数”
具体落地方式是 skill:
“A skill is just a way to instruct the agent how to teach the thing. I could have a skill for micro GPT of the progression I imagine the agent should take you through if you’re interested in understanding the code base.”
——以后的”教程”是给 agent 看的脚本,不是给人看的网页。markdown for agents 替代 HTML for humans。
他自己测试过把 micro GPT “boil down”(精简)的任务交给 agent:“agent 做不到。它能理解 micro GPT 为什么这么写,但它没法独立 distill 出这个版本。这是我的 contribution。其他的解释工作 agent 比我做得好。”
由此他对个人贡献的态度:
“The things that agents can’t do is your job now. The things that agents can do, they can probably do better than you, or very soon. So you should be strategic about what you’re spending time on.”
——agent 做不到的是你的工作。agent 能做的它早晚比你做得好。你要在分配时间时策略性。
拧巴 / 我的怀疑(独立放在最后,不混进正文)
这场访谈本身质量很高,论点链清晰。我注意到的几个内部张力:
“frontier lab vs 外面”那段三段自相矛盾(见 §10)。Karpathy 自己承认了,所以不是 bug 是 feature——但任何引用他这段的人要警惕:他没下结论,引用方不要替他下结论。
“speciation 没发生是因为 fine-tune 科学不成熟”这句论断我打个问号。Apple、Adept、Cohere 的失败到底是技术不够还是商业模式(垂直市场太小、训练成本摊不平)?两个解释互不排斥但权重不同。访谈里 Karpathy 没区分。
“FLOPS 当货币”这个比喻他自己说”不想推太远”,但已经推得不少了。“现在有钱也拿不到算力” → “FLOP 已经主导”——这个推理跳了一步:稀缺 ≠ 主导货币。原油也稀缺,但没人用桶数支付。这点他没想透。
Jevons Paradox 应用到软件:他用 ATM-柜员 类比软件-工程师。但 ATM 替代的是一项任务(取款),柜员还有别的任务(销售、关系);agent 替代的是整个数字工作流。类比不完全对称。短期他对就业的乐观可能对,长期未必。
对 Justin 的相关性(写完之后单独的一节,不强加)
几个对你工作的连接点:
- Dobby 这套”app 不该存在,应该是 API + agent” 跟你正在做的 dev hub / skills 系统是同一个判断
- “教 agent 不教人 / markdown for agents” 跟你 skills 文档 + handoff 体系完全对得上 —— Karpathy 是从教学者视角说出了你已经在做的事
- micro GPT 的”剥到 200 行”哲学 跟你 CLAUDE.md “最少代码、不要脑补、克制” 那条铁律呼应
- frontier lab judgment drift 这条对你做投资判断有方法论意义——不在 frontier lab 内的人对前沿做判断会系统性失真,需要刻意补
- FLOPS 当货币 是个还没成形的赛道信号——值得记着,未必现在做
要继续讨论的话,我会从这几个点里挑一个:jaggedness 的解释(verifiability vs 经济因素到底哪个权重大)、speciation 论断的独立验证、还是 Dobby 那套”客户是 agent 不是人”对工业基础设施改造路径的具体含义。