← All Articles

Cursor's Third Era: Cloud Agents

Latent Space Podcast / swyx · 2026-03-07 · Original

来源: Latent Space Podcast / swyx | 日期: 2026-03-06 频道: Latent Space: The AI Engineer Podcast 时长: 01:06:38 原文: Cursor’s Third Era: Cloud Agents 精读日期: 2026-03-07

一句话总结

$50B 估值的 Cursor 宣布 Cloud Agents 使用量已超过 Tab Autocomplete,收购 Graphite(代码审查)和 Autotab(Computer Use)后推出完整云端开发体验,标志着软件开发进入”第三纪元”——从手写代码到 AI 补全,再到完全自主的云端 Agent 集群。

核心内容

软件开发的三个时代

时代 形态 交互方式 月费量级
Era 1 Tab Autocomplete 逐行补全,人手动编辑 ~$20
Era 2 Local Agents 对话式编程,Agent 改代码人审查 diff ~$200
Era 3 Cloud Agents Agent 在云端 VM 自主开发+测试+录屏,人审视频和预览 $1,000-$10,000+

关键数据点:在 Cursor 内部,Agent 使用量已正式超过 Tab Autocomplete。Cursor 内部已经把手动敲代码称为”hand coding”,带有一种”过时”的语感。

Cloud Agents 三大支柱

  1. 自主测试:Agent 不仅写代码,还自动启动 DevServer、运行端到端测试、迭代修复。交给人的是”测试通过的 PR”而非”试了些东西的 PR”
  2. 录屏回放:每个 Agent 完成后生成操作视频,包含章节标记。审查视频远比审查 700 行 diff 高效——尤其配合 Best-of-N 跑 4 个模型,看 4 个 22 秒视频就能选最好的
  3. 远程桌面(VNC):人可以直接接管 Agent 的 VM,上传文件、操作浏览器、试用功能,没有任何替代品能取代”亲自上手试”的体验

重要产品能力

Slash Commands 体系: - /repro:Bug 修复专用。Agent 先录视频复现 Bug → 修复 → 再录视频证明修复成功(经典红绿 TDD) - /no-test:跳过测试,用于简单文案改动 - /council:多模型 Council 模式——多个模型并行跑同一任务,合成最优结果

Best-of-N 并行:在 Cloud Agent 中同时启动 5 个模型(各自独立 VM),看 5 个视频选最好的。比 worktree 方案好得多(worktree 端口冲突、管理混乱)

Subagents: - 内置 explore subagent(快速用小模型探索代码库) - Computer Use subagent(处理长图像序列的测试验证) - Agent 可自主决定拆分子任务给 subagents,是天然的上下文管理边界

Grind Mode(长时间运行 Agent): - 源自 Wilson 构建浏览器的实验,已有连续运行三天的记录 - 关键设计:开始前必须有 Planning 阶段,agent 和人达成一致后才进入执行 - 单 worker → 多 worker 协作(planner + workers 社会化协作)

Slack 变成了开发 IDE

Cursor 内部最大的工作流变化:Slack 成为事实上的开发环境。在 Slack 频道中 @cursor 启动 cloud agent,团队成员可以接力跟进、补充上下文、查看 Agent 产出。Agent 甚至可以 git blame 找到相关人员并在 Slack 中 @他们

讨论从”谁来写这个代码”变成”我们喜欢这个 UX 吗”——人类只讨论真正有趣的高阶问题

下一个瓶颈:从 PR 到 Production

Memory 和 Self-Awareness

Samantha 的核心观点(可能是全文最有洞察力的部分):

模型选择与路由

Jonas 的年终预测

Cloud Agent 用量年底前将超过 Local Agent 用量,且可能达到 2x 以上。但实现的时间会比预期稍长,主要卡在 sandbox 环境配置(onboarding)和 memory 能力。

金句摘录

Justin 视角

对投资判断的参考价值

  1. “IDE is Dead” 不是噱头,有数据支撑。Cursor 自身数据显示 Agent > Tab,这意味着整个 Developer Tools 赛道正在被重新定义。传统的 IDE、CI/CD、Code Review 工具都面临 paradigm shift。Graphite 被收购验证了”code review for AI-generated code”是真实需求

  2. 吞吐量 > 延迟的 mental model 很重要。未来不是”一个人+一个 AI 做得更快”,而是”一个人+100个并行 Agent 做 10x 的事”。这对算力需求的影响是指数级的——Jonas 直言”最乐观的算力预测可能都低估了”。这对 AI infra/芯片投资有重要参考

  3. Agent Memory/Self-Awareness 是下一个关键差异化方向。Samantha 的 “memory as self-auditability” 观点非常深刻,与我们在 CC 上做的记忆系统方向一致。值得关注做 Agent memory infrastructure 的创业公司

  4. Jevons Paradox 在 AI coding 中完美复现。从 $20→$200→$1000+/月/开发者,效率越高花的越多。这意味着 AI coding 市场天花板远高于当前估值模型

  5. Slack 成为 IDE 的趋势值得关注。意味着 AI coding 不只是开发者工具,而是团队协作工具。这扩大了 TAM,但也意味着与 Slack/Linear/Notion 等的竞合关系会更复杂

可行动的 takeaway: - Cursor 的 Cloud Agent 架构(VM + Computer Use + video review + memory)可以作为评估其他 AI coding 工具的 benchmark - 关注 Agent-to-Agent 协作(subagents, council, grind mode)方向的创业机会 - 开发者工具 portfolio 需要重新评估:传统 CI/CD 和 code review 的护城河在 Agent 时代还成立吗?

延伸阅读