精读 Loopcraft——"堆叠 loop" 这个概念是什么，对你意味着什么

2026-06-14 · Original

受众：Justin（红杉中国 MD）原文：Latent Space（swyx 的 AINews）2026-06-12，高亮 Peter Steinberger、Boris Cherny、Andrej Karpathy 三人的”loop discourse” 你的需求：讲清楚这个 loop 概念是什么 + 对你有什么意义和价值

一、这个概念到底在说什么

一句话：别再亲自给 agent 写 prompt 了，去设计”循环”（loop），让循环自动驱动 agent 干活。

三个人的原话最能说明：

Peter Steinberger：“你不该再给 coding agent 写 prompt 了。你应该设计循环，让循环来给你的 agent 写 prompt。”
Boris Cherny（Claude Code 核心）：“我不再给 Claude 写 prompt 了。我写循环，循环来干活。”
Andrej Karpathy（讲他做自动研究）：“要把这些工具用到极致，你得把自己从瓶颈位置上拿掉。你不能守在那儿等着发起下一个 prompt。你得把自己挪到循环外面，安排好让一切完全自主运行。现在游戏的名字就是提高你的杠杆……我不想当那个守在循环里看结果的研究员，我在拖系统的后腿。所以问题变成：怎么重构所有抽象层，让我不必在场——安排一次，按下开始。”

核心转变：从”人在循环里一次次发指令”（human-in-the-loop）变成”人设计循环、然后退到循环外”（human-on-the-loop）。你的角色从”操作者”变成”循环的设计者和所有者”。

二、“堆叠 loop”是什么意思

文章的关键洞察：我们其实已经身处很多层 loop 里，只是没意识到。

举例（从小到大堆叠）： - 最内层：模型生成 token 的循环（写一个字、再写一个字） - 往上：agent 调工具的循环（写码 → 跑测试 → 看报错 → 改 → 再跑） - 再往上：你给 agent 派任务的循环（提需求 → agent 做 → 你 review → 再派下一个） - 更往上：你安排多个 agent 并行、自己只定目标和验收的循环 - 最外层：设计一套系统，让上面这些循环自己跑，你只在出大问题时介入

“loopcraft”（循环工艺）就是把这些 loop 一层层堆起来、并且知道什么时候该在哪一层操作的能力。

文章给了一个很精炼的判断（我认为是全文最值钱的一句）：

在每个阶段的早期，当事情出错时，知道往”下”走一层（降到更细的循环）很有价值——为了可靠性；但随着模型变强，知道往”上”走一层（升到更高的循环）会更有价值——为了杠杆。如果你不学会怎么往上走，等你输给那些学会的人时，别不服气。

翻译成人话：模型不行的时候你得能下沉到细节去兜底（保证靠谱）；模型变强之后，真正拉开差距的是你敢不敢、会不会往上抽身，把更多决策交给系统（放大杠杆）。

三、“Salty Lesson”——对 Rich Sutton “Bitter Lesson” 的致敬和延伸

Rich Sutton 有著名的 Bitter Lesson（苦涩的教训）：AI 研究里，靠堆算力和数据的通用方法，长期总是赢过人类手工设计的精巧方法。

文章提出 agent 时代的 Salty Lesson（“不服气的教训”，salty 是”输了还嘴硬”的意思）：

别再像过去那样自己动手修东西。

要把精力放在”能随着 agent 数量增加而扩展的系统”上——比如目标设定和编排（orchestration，指协调调度多个 agent）。

逻辑和 Bitter Lesson 同构：手工干预不可扩展，会被”设计可扩展系统”的方法打败。你越亲自下场修，越被那些”搭好系统让 agent 自己跑”的人甩开。

四、这个概念为什么现在火（背景）

文章这期还顺带提了一批同期信号，都指向同一个方向——“人退到循环外、系统自主运行”正在从理念变成产品和数据：

自动研究系统出成果：Richard Socher 的 Recursive SI 在 NanoGPT Speedrun、NanoChat 等高反馈优化任务上做到 SOTA；微软 Arbor（持续假设树精炼的自主研究 agent）号称在 6 个研究任务上超过 Codex 和 Claude Code。共同点：在”窄、高反馈、可自动验证”的任务上，自主系统已经能贡献了——这跟我之前给你的 Salesforce 精读、Good AI PM 是同一条边界线。
managed agent 变成可调度的基础设施：Claude Managed Agents 加了定时部署 + 环境变量（凭证在网络边界交换、不暴露给模型）——agent 正在从”聊天模式”变成”持久运行的服务”。这正是 loop 思维的产品化。
讨论重心从”哪个模型最好”转向”执行控制 / review 层 / 可观测性 / 可移植性”：Cursor 把 auto-review 设为默认、LangSmith 出网关带审计——大家在搭的是”让循环可靠自跑”的护栏。

五、对你的意义和价值

作为投资人，这是一把判断标尺

看 AI 应用 / agent 工具标的时，问一个问题：它帮用户停在哪一层 loop？
- 只帮用户”更快写 prompt”的产品（停在最内层）→ 价值会随模型变强被稀释
- 帮用户”设计循环、退到循环外”的产品（往上走）→ 这是杠杆所在，更可能有持续价值
- 这条和 Salesforce 精读那条”判断 AI 提效看下游有没有被接住”是一套——都是穿透”AI 提效”叙事看实质
“窄、高反馈、可自动验证”是 agent 自主化当前的真实边界。文章里自动研究系统出成果的全是这类任务（kernel 优化、speedrun）；专家级综合判断（SciConBench、Agents’ Last Exam 最难档）agent 还是 0 分。看标的声称的自主能力时，用这条边界检验。
“往上走一层”是稀缺能力，也是稀缺人才信号。文章说会往上走的人会赢——反过来，你看创始人/团队时，能不能判断”哪些该交给系统、哪些该留在人手里”，是 AI 时代的核心 founder 能力（和 Good AI PM 那篇”委派 vs 留在环内”是同一判断）。

作为重度 AI 用户，这是工作方式的升级方向

你现在的用法大概还在”派任务 → 看结果 → 再派”这一层（human-in-the-loop）。Loopcraft 指的方向是：把你反复做的研究/精读/调研流程，设计成”循环”——定好目标、规则、验收标准、失败兜底，然后让它自己跑，你只在关键节点介入。

具体到你的场景，可迁移的一条：你让我做的精读/调研，本身就可以 loop 化——比如”每天自动扫某批源 → 按你的兴趣过滤 → 出浅读 → 你只看值得升精读的”。AI 日报其实已经是一个 loop（只是还需要人扫码维护）。Loopcraft 的提醒是：哪里还有你在当瓶颈、反复手动发指令的地方，那里就有往上抽一层的机会。

六、一句话总判

Loopcraft 不是新工具，是个心智转变：从”给 agent 写 prompt”升级到”设计让 agent 自己跑的循环”，并学会在模型变强时主动往上抽身（放大杠杆）而不是守在细节里。

对你最直接的两个用处：① 当投资标尺——判断 agent 产品/团队是停在内层（会被稀释）还是帮人往上走（有杠杆）；② 当工作方式提醒——找到你还在当瓶颈手动发指令的地方，把它 loop 化。

最该记住的一句是那个”Salty Lesson”：别自己动手修，去搭能随 agent 数量扩展的系统（目标 + 编排）——和 Sutton 的 Bitter Lesson 同构，手工干预终将输给可扩展系统。

主要来源

AINews: Loopcraft — The Art of Stacking Loops（Latent Space / swyx，2026-06-12） — 高亮 Peter Steinberger（@steipete）、Boris Cherny（@bcherny，Claude Code）、Andrej Karpathy 的 loop 论述
概念渊源：Rich Sutton《The Bitter Lesson》（2019）

配套（同主题，你已读过）

~/CC/Learning/Daily Digest/2026-06-14-salesforce-agentic-engineering-deep-read.md（人退到循环外、Agent 接住下游）
~/CC/Learning/Daily Digest/2026-06-10-dvasishtha-good-ai-pm-bad-ai-pm.md（委派 vs 留在环内）
mental model：Agent 转型成败看下游同步（mental-models.md）