Cursor's Third Era: Cloud Agents

Latent Space Podcast / swyx · 2026-03-06 · Original

来源: Latent Space Podcast / swyx | 日期: 2026-03-06 频道: Latent Space: The AI Engineer Podcast 时长: 01:06:38 原文: Cursor’s Third Era: Cloud Agents 精读日期: 2026-03-07

一句话总结

$50B 估值的 Cursor 宣布 Cloud Agents 使用量已超过 Tab Autocomplete，收购 Graphite（代码审查）和 Autotab（Computer Use）后推出完整云端开发体验，标志着软件开发进入”第三纪元”——从手写代码到 AI 补全，再到完全自主的云端 Agent 集群。

核心内容

软件开发的三个时代

时代	形态	交互方式	月费量级
Era 1	Tab Autocomplete	逐行补全，人手动编辑	~$20
Era 2	Local Agents	对话式编程，Agent 改代码人审查 diff	~$200
Era 3	Cloud Agents	Agent 在云端 VM 自主开发+测试+录屏，人审视频和预览	$1,000-$10,000+

关键数据点：在 Cursor 内部，Agent 使用量已正式超过 Tab Autocomplete。Cursor 内部已经把手动敲代码称为”hand coding”，带有一种”过时”的语感。

Cloud Agents 三大支柱

自主测试：Agent 不仅写代码，还自动启动 DevServer、运行端到端测试、迭代修复。交给人的是”测试通过的 PR”而非”试了些东西的 PR”
录屏回放：每个 Agent 完成后生成操作视频，包含章节标记。审查视频远比审查 700 行 diff 高效——尤其配合 Best-of-N 跑 4 个模型，看 4 个 22 秒视频就能选最好的
远程桌面（VNC）：人可以直接接管 Agent 的 VM，上传文件、操作浏览器、试用功能，没有任何替代品能取代”亲自上手试”的体验

重要产品能力

Slash Commands 体系： - /repro：Bug 修复专用。Agent 先录视频复现 Bug → 修复 → 再录视频证明修复成功（经典红绿 TDD） - /no-test：跳过测试，用于简单文案改动 - /council：多模型 Council 模式——多个模型并行跑同一任务，合成最优结果

Best-of-N 并行：在 Cloud Agent 中同时启动 5 个模型（各自独立 VM），看 5 个视频选最好的。比 worktree 方案好得多（worktree 端口冲突、管理混乱）

Subagents： - 内置 explore subagent（快速用小模型探索代码库） - Computer Use subagent（处理长图像序列的测试验证） - Agent 可自主决定拆分子任务给 subagents，是天然的上下文管理边界

Grind Mode（长时间运行 Agent）： - 源自 Wilson 构建浏览器的实验，已有连续运行三天的记录 - 关键设计：开始前必须有 Planning 阶段，agent 和人达成一致后才进入执行 - 单 worker → 多 worker 协作（planner + workers 社会化协作）

Slack 变成了开发 IDE

Cursor 内部最大的工作流变化：Slack 成为事实上的开发环境。在 Slack 频道中 @cursor 启动 cloud agent，团队成员可以接力跟进、补充上下文、查看 Agent 产出。Agent 甚至可以 git blame 找到相关人员并在 Slack 中 @他们。

讨论从”谁来写这个代码”变成”我们喜欢这个 UX 吗”——人类只讨论真正有趣的高阶问题。

下一个瓶颈：从 PR 到 Production

代码生成太容易了，“I have a PR for that” 成了口头禅
瓶颈转移到：CI/CD 容量（内部已打爆 GitHub Actions）、code review、部署管线
10 人创业团队现在需要 10,000 人公司的 DevOps 基础设施（merge queues, stack diffs, staged releases）
Graphite 收购正是解决这个问题

Memory 和 Self-Awareness

Samantha 的核心观点（可能是全文最有洞察力的部分）：

Memory 本质上是 file system 问题——给 Agent 标注、指针、链接到相关文件
Memory 是 Agent 自我审计能力（self-auditability）的子集
Agent 应该能自主发现自身能力缺口，提议创建 memory/annotation 来填补
Agent 应该能发现冲突的指令（skills/rules 互相干扰）
Agent 应该能自己修复 DevOps 问题
终极方向：Agent 编辑自己的 system prompt

模型选择与路由

Samantha 从 Opus 4.5 死忠切换到 Codex 5.3（模型忠诚度变化很快）
Cursor Auto 路由即将扩展到 Cloud Agents
多模型 synergy 真实存在：不同 provider 的模型组合 > 单一顶级模型

Jonas 的年终预测

Cloud Agent 用量年底前将超过 Local Agent 用量，且可能达到 2x 以上。但实现的时间会比预期稍长，主要卡在 sandbox 环境配置（onboarding）和 memory 能力。

金句摘录

“We call it hand coding now, when you type out the actual letters. You’re so boomer.” — Jonas
“I have more ambitions than I did before. I’m busier than ever. I’m using more tokens and I’m also doing more things.” — Samantha（Jevons Paradox 的完美注脚）
“If a human gave you a PR and they hadn’t tested it, you’d be annoyed. Only ask me for a review once it’s actually ready.” — Jonas
“Memory is a subset of agent self-auditability and self-awareness.” — Samantha
“10-person startups now need the DevOps pipelines that 10,000-person companies used to need.” — Jonas
“You solve one bottleneck and three new ones pop up.” — Jonas

Justin 视角

对投资判断的参考价值：

“IDE is Dead” 不是噱头，有数据支撑。Cursor 自身数据显示 Agent > Tab，这意味着整个 Developer Tools 赛道正在被重新定义。传统的 IDE、CI/CD、Code Review 工具都面临 paradigm shift。Graphite 被收购验证了”code review for AI-generated code”是真实需求
吞吐量 > 延迟的 mental model 很重要。未来不是”一个人+一个 AI 做得更快”，而是”一个人+100个并行 Agent 做 10x 的事”。这对算力需求的影响是指数级的——Jonas 直言”最乐观的算力预测可能都低估了”。这对 AI infra/芯片投资有重要参考
Agent Memory/Self-Awareness 是下一个关键差异化方向。Samantha 的 “memory as self-auditability” 观点非常深刻，与我们在 CC 上做的记忆系统方向一致。值得关注做 Agent memory infrastructure 的创业公司
Jevons Paradox 在 AI coding 中完美复现。从 $20→$200→$1000+/月/开发者，效率越高花的越多。这意味着 AI coding 市场天花板远高于当前估值模型
Slack 成为 IDE 的趋势值得关注。意味着 AI coding 不只是开发者工具，而是团队协作工具。这扩大了 TAM，但也意味着与 Slack/Linear/Notion 等的竞合关系会更复杂

可行动的 takeaway： - Cursor 的 Cloud Agent 架构（VM + Computer Use + video review + memory）可以作为评估其他 AI coding 工具的 benchmark - 关注 Agent-to-Agent 协作（subagents, council, grind mode）方向的创业机会 - 开发者工具 portfolio 需要重新评估：传统 CI/CD 和 code review 的护城河在 Agent 时代还成立吗？