精读 Loopcraft——"堆叠 loop" 这个概念是什么,对你意味着什么
受众:Justin(红杉中国 MD) 原文:Latent Space(swyx 的 AINews)2026-06-12,高亮 Peter Steinberger、Boris Cherny、Andrej Karpathy 三人的”loop discourse” 你的需求:讲清楚这个 loop 概念是什么 + 对你有什么意义和价值
一、这个概念到底在说什么
一句话:别再亲自给 agent 写 prompt 了,去设计”循环”(loop),让循环自动驱动 agent 干活。
三个人的原话最能说明:
- Peter Steinberger:“你不该再给 coding agent 写 prompt 了。你应该设计循环,让循环来给你的 agent 写 prompt。”
- Boris Cherny(Claude Code 核心):“我不再给 Claude 写 prompt 了。我写循环,循环来干活。”
- Andrej Karpathy(讲他做自动研究):“要把这些工具用到极致,你得把自己从瓶颈位置上拿掉。你不能守在那儿等着发起下一个 prompt。你得把自己挪到循环外面,安排好让一切完全自主运行。现在游戏的名字就是提高你的杠杆……我不想当那个守在循环里看结果的研究员,我在拖系统的后腿。所以问题变成:怎么重构所有抽象层,让我不必在场——安排一次,按下开始。”
核心转变:从”人在循环里一次次发指令”(human-in-the-loop)变成”人设计循环、然后退到循环外”(human-on-the-loop)。你的角色从”操作者”变成”循环的设计者和所有者”。
二、“堆叠 loop”是什么意思
文章的关键洞察:我们其实已经身处很多层 loop 里,只是没意识到。
举例(从小到大堆叠): - 最内层:模型生成 token 的循环(写一个字、再写一个字) - 往上:agent 调工具的循环(写码 → 跑测试 → 看报错 → 改 → 再跑) - 再往上:你给 agent 派任务的循环(提需求 → agent 做 → 你 review → 再派下一个) - 更往上:你安排多个 agent 并行、自己只定目标和验收的循环 - 最外层:设计一套系统,让上面这些循环自己跑,你只在出大问题时介入
“loopcraft”(循环工艺)就是把这些 loop 一层层堆起来、并且知道什么时候该在哪一层操作的能力。
文章给了一个很精炼的判断(我认为是全文最值钱的一句):
在每个阶段的早期,当事情出错时,知道往”下”走一层(降到更细的循环)很有价值——为了可靠性;但随着模型变强,知道往”上”走一层(升到更高的循环)会更有价值——为了杠杆。如果你不学会怎么往上走,等你输给那些学会的人时,别不服气。
翻译成人话:模型不行的时候你得能下沉到细节去兜底(保证靠谱);模型变强之后,真正拉开差距的是你敢不敢、会不会往上抽身,把更多决策交给系统(放大杠杆)。
三、“Salty Lesson”——对 Rich Sutton “Bitter Lesson” 的致敬和延伸
Rich Sutton 有著名的 Bitter Lesson(苦涩的教训):AI 研究里,靠堆算力和数据的通用方法,长期总是赢过人类手工设计的精巧方法。
文章提出 agent 时代的 Salty Lesson(“不服气的教训”,salty 是”输了还嘴硬”的意思):
- 别再像过去那样自己动手修东西。
- 要把精力放在”能随着 agent 数量增加而扩展的系统”上——比如目标设定和编排(orchestration,指协调调度多个 agent)。
逻辑和 Bitter Lesson 同构:手工干预不可扩展,会被”设计可扩展系统”的方法打败。你越亲自下场修,越被那些”搭好系统让 agent 自己跑”的人甩开。
四、这个概念为什么现在火(背景)
文章这期还顺带提了一批同期信号,都指向同一个方向——“人退到循环外、系统自主运行”正在从理念变成产品和数据:
- 自动研究系统出成果:Richard Socher 的 Recursive SI 在 NanoGPT Speedrun、NanoChat 等高反馈优化任务上做到 SOTA;微软 Arbor(持续假设树精炼的自主研究 agent)号称在 6 个研究任务上超过 Codex 和 Claude Code。共同点:在”窄、高反馈、可自动验证”的任务上,自主系统已经能贡献了——这跟我之前给你的 Salesforce 精读、Good AI PM 是同一条边界线。
- managed agent 变成可调度的基础设施:Claude Managed Agents 加了定时部署 + 环境变量(凭证在网络边界交换、不暴露给模型)——agent 正在从”聊天模式”变成”持久运行的服务”。这正是 loop 思维的产品化。
- 讨论重心从”哪个模型最好”转向”执行控制 / review 层 / 可观测性 / 可移植性”:Cursor 把 auto-review 设为默认、LangSmith 出网关带审计——大家在搭的是”让循环可靠自跑”的护栏。
五、对你的意义和价值
作为投资人,这是一把判断标尺
看 AI 应用 / agent 工具标的时,问一个问题:它帮用户停在哪一层 loop?
- 只帮用户”更快写 prompt”的产品(停在最内层)→ 价值会随模型变强被稀释
- 帮用户”设计循环、退到循环外”的产品(往上走)→ 这是杠杆所在,更可能有持续价值
- 这条和 Salesforce 精读那条”判断 AI 提效看下游有没有被接住”是一套——都是穿透”AI 提效”叙事看实质
“窄、高反馈、可自动验证”是 agent 自主化当前的真实边界。文章里自动研究系统出成果的全是这类任务(kernel 优化、speedrun);专家级综合判断(SciConBench、Agents’ Last Exam 最难档)agent 还是 0 分。看标的声称的自主能力时,用这条边界检验。
“往上走一层”是稀缺能力,也是稀缺人才信号。文章说会往上走的人会赢——反过来,你看创始人/团队时,能不能判断”哪些该交给系统、哪些该留在人手里”,是 AI 时代的核心 founder 能力(和 Good AI PM 那篇”委派 vs 留在环内”是同一判断)。
作为重度 AI 用户,这是工作方式的升级方向
你现在的用法大概还在”派任务 → 看结果 → 再派”这一层(human-in-the-loop)。Loopcraft 指的方向是:把你反复做的研究/精读/调研流程,设计成”循环”——定好目标、规则、验收标准、失败兜底,然后让它自己跑,你只在关键节点介入。
具体到你的场景,可迁移的一条:你让我做的精读/调研,本身就可以 loop 化——比如”每天自动扫某批源 → 按你的兴趣过滤 → 出浅读 → 你只看值得升精读的”。AI 日报其实已经是一个 loop(只是还需要人扫码维护)。Loopcraft 的提醒是:哪里还有你在当瓶颈、反复手动发指令的地方,那里就有往上抽一层的机会。
六、一句话总判
Loopcraft 不是新工具,是个心智转变:从”给 agent 写 prompt”升级到”设计让 agent 自己跑的循环”,并学会在模型变强时主动往上抽身(放大杠杆)而不是守在细节里。
对你最直接的两个用处:① 当投资标尺——判断 agent 产品/团队是停在内层(会被稀释)还是帮人往上走(有杠杆);② 当工作方式提醒——找到你还在当瓶颈手动发指令的地方,把它 loop 化。
最该记住的一句是那个”Salty Lesson”:别自己动手修,去搭能随 agent 数量扩展的系统(目标 + 编排)——和 Sutton 的 Bitter Lesson 同构,手工干预终将输给可扩展系统。
主要来源
- AINews: Loopcraft — The Art of Stacking Loops(Latent Space / swyx,2026-06-12) — 高亮 Peter Steinberger(@steipete)、Boris Cherny(@bcherny,Claude Code)、Andrej Karpathy 的 loop 论述
- 概念渊源:Rich Sutton《The Bitter Lesson》(2019)
配套(同主题,你已读过)
~/CC/Learning/Daily Digest/2026-06-14-salesforce-agentic-engineering-deep-read.md(人退到循环外、Agent 接住下游)~/CC/Learning/Daily Digest/2026-06-10-dvasishtha-good-ai-pm-bad-ai-pm.md(委派 vs 留在环内)- mental
model:
Agent 转型成败看下游同步(mental-models.md)