Cursor's Third Era: Cloud Agents
来源: Latent Space Podcast / swyx | 日期: 2026-03-06 频道: Latent Space: The AI Engineer Podcast 时长: 01:06:38 原文: Cursor’s Third Era: Cloud Agents 精读日期: 2026-03-07
一句话总结
$50B 估值的 Cursor 宣布 Cloud Agents 使用量已超过 Tab Autocomplete,收购 Graphite(代码审查)和 Autotab(Computer Use)后推出完整云端开发体验,标志着软件开发进入”第三纪元”——从手写代码到 AI 补全,再到完全自主的云端 Agent 集群。
核心内容
软件开发的三个时代
| 时代 | 形态 | 交互方式 | 月费量级 |
|---|---|---|---|
| Era 1 | Tab Autocomplete | 逐行补全,人手动编辑 | ~$20 |
| Era 2 | Local Agents | 对话式编程,Agent 改代码人审查 diff | ~$200 |
| Era 3 | Cloud Agents | Agent 在云端 VM 自主开发+测试+录屏,人审视频和预览 | $1,000-$10,000+ |
关键数据点:在 Cursor 内部,Agent 使用量已正式超过 Tab Autocomplete。Cursor 内部已经把手动敲代码称为”hand coding”,带有一种”过时”的语感。
Cloud Agents 三大支柱
- 自主测试:Agent 不仅写代码,还自动启动 DevServer、运行端到端测试、迭代修复。交给人的是”测试通过的 PR”而非”试了些东西的 PR”
- 录屏回放:每个 Agent 完成后生成操作视频,包含章节标记。审查视频远比审查 700 行 diff 高效——尤其配合 Best-of-N 跑 4 个模型,看 4 个 22 秒视频就能选最好的
- 远程桌面(VNC):人可以直接接管 Agent 的 VM,上传文件、操作浏览器、试用功能,没有任何替代品能取代”亲自上手试”的体验
重要产品能力
Slash Commands 体系: - /repro:Bug
修复专用。Agent 先录视频复现 Bug → 修复 → 再录视频证明修复成功(经典红绿
TDD) - /no-test:跳过测试,用于简单文案改动 -
/council:多模型 Council
模式——多个模型并行跑同一任务,合成最优结果
Best-of-N 并行:在 Cloud Agent 中同时启动 5 个模型(各自独立 VM),看 5 个视频选最好的。比 worktree 方案好得多(worktree 端口冲突、管理混乱)
Subagents: - 内置 explore subagent(快速用小模型探索代码库) - Computer Use subagent(处理长图像序列的测试验证) - Agent 可自主决定拆分子任务给 subagents,是天然的上下文管理边界
Grind Mode(长时间运行 Agent): - 源自 Wilson 构建浏览器的实验,已有连续运行三天的记录 - 关键设计:开始前必须有 Planning 阶段,agent 和人达成一致后才进入执行 - 单 worker → 多 worker 协作(planner + workers 社会化协作)
Slack 变成了开发 IDE
Cursor 内部最大的工作流变化:Slack
成为事实上的开发环境。在 Slack 频道中 @cursor 启动 cloud
agent,团队成员可以接力跟进、补充上下文、查看 Agent 产出。Agent 甚至可以
git blame 找到相关人员并在 Slack 中 @他们。
讨论从”谁来写这个代码”变成”我们喜欢这个 UX 吗”——人类只讨论真正有趣的高阶问题。
下一个瓶颈:从 PR 到 Production
- 代码生成太容易了,“I have a PR for that” 成了口头禅
- 瓶颈转移到:CI/CD 容量(内部已打爆 GitHub Actions)、code review、部署管线
- 10 人创业团队现在需要 10,000 人公司的 DevOps 基础设施(merge queues, stack diffs, staged releases)
- Graphite 收购正是解决这个问题
Memory 和 Self-Awareness
Samantha 的核心观点(可能是全文最有洞察力的部分):
- Memory 本质上是 file system 问题——给 Agent 标注、指针、链接到相关文件
- Memory 是 Agent 自我审计能力(self-auditability)的子集
- Agent 应该能自主发现自身能力缺口,提议创建 memory/annotation 来填补
- Agent 应该能发现冲突的指令(skills/rules 互相干扰)
- Agent 应该能自己修复 DevOps 问题
- 终极方向:Agent 编辑自己的 system prompt
模型选择与路由
- Samantha 从 Opus 4.5 死忠切换到 Codex 5.3(模型忠诚度变化很快)
- Cursor Auto 路由即将扩展到 Cloud Agents
- 多模型 synergy 真实存在:不同 provider 的模型组合 > 单一顶级模型
Jonas 的年终预测
Cloud Agent 用量年底前将超过 Local Agent 用量,且可能达到 2x 以上。但实现的时间会比预期稍长,主要卡在 sandbox 环境配置(onboarding)和 memory 能力。
金句摘录
- “We call it hand coding now, when you type out the actual letters. You’re so boomer.” — Jonas
- “I have more ambitions than I did before. I’m busier than ever. I’m using more tokens and I’m also doing more things.” — Samantha(Jevons Paradox 的完美注脚)
- “If a human gave you a PR and they hadn’t tested it, you’d be annoyed. Only ask me for a review once it’s actually ready.” — Jonas
- “Memory is a subset of agent self-auditability and self-awareness.” — Samantha
- “10-person startups now need the DevOps pipelines that 10,000-person companies used to need.” — Jonas
- “You solve one bottleneck and three new ones pop up.” — Jonas
Justin 视角
对投资判断的参考价值:
“IDE is Dead” 不是噱头,有数据支撑。Cursor 自身数据显示 Agent > Tab,这意味着整个 Developer Tools 赛道正在被重新定义。传统的 IDE、CI/CD、Code Review 工具都面临 paradigm shift。Graphite 被收购验证了”code review for AI-generated code”是真实需求
吞吐量 > 延迟的 mental model 很重要。未来不是”一个人+一个 AI 做得更快”,而是”一个人+100个并行 Agent 做 10x 的事”。这对算力需求的影响是指数级的——Jonas 直言”最乐观的算力预测可能都低估了”。这对 AI infra/芯片投资有重要参考
Agent Memory/Self-Awareness 是下一个关键差异化方向。Samantha 的 “memory as self-auditability” 观点非常深刻,与我们在 CC 上做的记忆系统方向一致。值得关注做 Agent memory infrastructure 的创业公司
Jevons Paradox 在 AI coding 中完美复现。从 $20→$200→$1000+/月/开发者,效率越高花的越多。这意味着 AI coding 市场天花板远高于当前估值模型
Slack 成为 IDE 的趋势值得关注。意味着 AI coding 不只是开发者工具,而是团队协作工具。这扩大了 TAM,但也意味着与 Slack/Linear/Notion 等的竞合关系会更复杂
可行动的 takeaway: - Cursor 的 Cloud Agent 架构(VM + Computer Use + video review + memory)可以作为评估其他 AI coding 工具的 benchmark - 关注 Agent-to-Agent 协作(subagents, council, grind mode)方向的创业机会 - 开发者工具 portfolio 需要重新评估:传统 CI/CD 和 code review 的护城河在 Agent 时代还成立吗?
延伸阅读
- Cursor Cloud Agents — 产品页面
- Cursor Onboarding — Jonas 特别强调的新用户入口
- Autotab(Jonas 创办,已被 Cursor 收购)— Computer Use 先驱
- New Computer(Samantha 创办,已被 Cursor 收购)— Personalized coding models
- Graphite(被 Cursor 收购)— Stack diffs / code review
- Codex 5.3 — Samantha 当前首选模型
- 值得追踪:Wilson(Cursor 内部构建浏览器实验/grind mode 发起者)