Agent 时代启示录：当 Agent 作为新物种加入经济系统

Cage / 拾象 · Original

Whole picture

拾象（Cage）提出的核心论点：衡量对象变了，互联网时代的分析框架（DAU/MAU、To B/To C、per-seat 定价、IT 预算锚）在 Agent 时代整体失效。真正的新坐标不是 To B/To C，而是 To Human / To Agent。

文章从现象（指标失效、软件被重写、旧范式熊市）推到概念（Agent 作为新物种加入经济系统），再到战略层（Agent = Model + Harness，Anthropic Managed Agents 的平台化意义），最后落到三个看好方向：Runtime（Agent Infra）、Context（Vertical Harness）、Orchestration（Agent Identity / Payment，“Agent 版 Plaid”）。

段 1 · 旧尺度在失效

作者论点：

Anthropic DAU < OpenAI 2%，但 ARR 追平（2026-03 年化 300 亿，同比 1400%）——价值集中在头部 token-heavy 任务，不在用户规模
付费从 per-seat → per-outcome（Decagon resolution 模型、Sierra “pay for a job well done”）
定价锚点从 IT 预算（千亿）迁移到人力成本池（全球白领工资 18-20 万亿美金，差 1-2 个数量级）
Prosumer 让 B/C 分类失灵——Claude Code / Cursor / Perplexity / Manus 工程师自购

我的解读：

最硬的 primitive 是锚点迁移——vertical AI 的 TAM 算法要重写：不再用”行业 SaaS 市场多大”算，而是用”职能全球工资总额 × 可替代比例 × take rate”算
潜台词：per-outcome 只在 outcome 可测量、可归因时成立。客服 ticket、code PR 可测量；战略 memo、创意设计难测量

段 2 · 软件正在被重写

作者论点：

软件从设计之初 To Human；Agent 不需要 GUI、不需要人类认知负担抽象
格式迁移：GUI→CLI/API、可视化→结构化数据、人类文档→机器可读 schema
Claude Code 选 CLI 是早期信号——“bash is everything for coding agents”
未来软件 = Model + Agent Harness + 按需生成的人类审阅层；下一代 Salesforce 不是 CRM，是 Agent 可读写的客户数据语义层

我的解读：

GUI 不会消失，但会从”应用主体”降级为”Agent 输出的临时渲染层”。人类只在决策点看
投资信号：谁把存量 SaaS 的数据层 Agent-native 化，谁就有机会切 Salesforce/Adobe/ServiceNow（关键词：语义层）
作者漏讲的维度：内容侧也要有 To Agent 版本。llms.txt 是苗头，远不够

段 3 · 旧范式的漫长熊市

作者论点：

每次平台迁移都是新范式原生公司赢（雅虎→Google、诺基亚→iPhone）
原因是旧范式的 winner pattern 在 DNA 层面互斥新范式
OpenAI 8 亿用户是战略包袱不是资产；Anthropic 没这个包袱

我的反驳：

作者选择性引用了成功替代案例，跳过反例：Microsoft（本地→SaaS 成功）、Adobe（盒装→订阅云成功）、AWS（电商内部衍生）
真规律不是”新玩家必赢”，是有组织代谢能力的公司能跨范式。Adobe 换得过去是 CEO Shantanu Narayen 主动砍了盒装业务
“8 亿用户是包袱”这个论断暴露了论证不够硬——ChatGPT 付费订阅约 60-80 亿 ARR 不会主动放弃。更准确的说法是”OpenAI 同时打两场战争，每条战线都做不到最纯粹”
作者自己找补”OpenAI 综合实力最强之一”、Sam 最近降 ChatGPT 优先级——这恰是立论反证

段 4 · To Agent：新物种加入经济系统

作者论点（全文价值承重墙）：

生产侧已发生：Anthropic 52 天发 70+ features（Agent 写 / 测 / 部署）；OpenAI Codex “no manual code”
消费侧正被基建化：Stripe Machine Payments Protocol、Cloudflare AI bot 分类——Agent 作为第一公民设计
闭环形成：Agent 写的 feature 被 Agent 调用、Agent 生成的数据被 Agent 消费、Agent 的采购由 Agent API 承接
“人类经济史上从未出现过：生产者和消费者同时是非人类的双边市场”

我的解读：

“Agent 是第一公民”是一个投资筛子：问”它把 Agent 作为 afterthought 还是 primary user”，能把装腔作势的”AI-ready”产品筛掉
作者没讲的暗礁——Agent 消费者需求结构和人类不同：
- 延迟敏感性低（容忍长延迟只要结果对）
- 价格敏感度极高（单次调用 0.1 美分都影响选型）
- 信任靠 benchmark/SLA/API 稳定性，不靠品牌
- 锁定靠状态/数据/生态，不靠 UI 肌肉记忆
推论：To Agent 市场虽然 TAM 巨大，但竞争逻辑接近纯 commodity，只有 state/context 平台级锁定能拿溢价
系统性风险：作者只讲闭环效率没讲闭环脆弱性——Agent 写 bug → Agent 调用 bug API → Agent 生产错误数据 → Agent 依赖错误数据决策。金融市场见过类似（算法交易闪崩）。可能需要”熔断机制”基建层

段 5 · Agent = Model + Harness

作者论点：

Harness = Agent 除模型外的所有组件（context、tool、memory、runtime、skills）
Anthropic 2026-04 发布 Managed Agents beta——战略意义大于技术意义
商业模式从 token 定价 → AWS 云平台模式；切换成本从”改几行代码”变成”重建整个 AI workflow”
LLM 公司第一次有了护城河
反直觉事实：2026 最好的 Harness 比 LangChain 薄得多（Opus 4.5 越过 Agentic 拐点后，越薄越强；Claude Code 核心 Agent Loop 只有几十行）

我的解读：

颠覆 VC 共识：过去两年流行叙事是”模型层 commodity、应用层吃价值”。Managed Agents 叙事成立 = 模型公司通过 harness 向上游吃应用层。Cursor/Cline/Devin 这类 harness 公司价值被压薄
“薄化”和”Managed”表面矛盾实则互为因果：正因为 harness 从 LangChain 重工程退化到几十行，Anthropic 才敢产品化
关键暗线：Harness 薄化是闭源模型公司的专属红利，不是普惠
- 闭源（Anthropic、OpenAI）：薄 harness 是”贴合模型性格的贴身衣”，能锁在自己这边
- 开源（Llama、Qwen、DeepSeek）：薄 harness 更难建立上层粘性，因为能被任何人 fork
- 推论：第三方 agent harness 创业公司估值长期被吞，只有深度 vertical 的 harness 能活
Anthropic 的第二曲线挑战：从”卖智能”→“卖服务”，毛利率下降 + 研发精力分散。Dario 需要一次组织代谢，比 Sam 砍消费产品优先级更难——Sam 砍的是包袱，Dario 要加的是运营复杂度

段 6 · 拾象看好的三个方向

作者三层机会地图：

Runtime 层（Agent Infra）：per-agent 状态隔离、Fork/Snapshot、Durable Execution、临时 DB/VM
Context 层（Vertical Harness）：Healthcare / Legal / Finance 优先，OpenEvidence / Rogo / Sierra 为早期样本
Orchestration 层：Agent Identity（身份证 + 工作许可）、Agent Payment（Stripe MPP 协议层 + “Agent 版 Plaid”的应用层）

我的评价（信号强度参差）：

Runtime 层：需求真实但赛道已挤（E2B / Modal / Daytona / Cloudflare Containers + Anthropic 自家 Code Execution Tool）。通用 Runtime 大概率被模型公司吞。能活的是 Anthropic/OpenAI 不愿意做的 runtime——企业内网、特殊合规、异构计算
Context 层 / Vertical Harness：最肥，护城河最稳。对接段 5 薄化红利反向推论——通用 harness 被吞，vertical harness 靠行业 know-how + 专有数据 + 客户关系立足
- 作者名单外补充两个 sleeper：Tax & Compliance、Construction / Industrial Estimating（中美少人做）
Orchestration 层：最性感但最难下手
- “Agent 版 Plaid”类比的坑：Stripe 不像传统银行那么僵化，可能自己做 Plaid 层
- Agent Identity 比 Payment 更早期，是赌协议战争赢家
- 建议：小额早期押赛道，1-2 年协议稳定后再 double down
作者遗漏：完全没提 Agent-to-Agent 通信协议（A2A、MCP、ACP）。这一层未来会出现”TCP/IP 时刻”

Discussion 补充（2026-04-22）

今日讨论产出的几个 primitive 和新判断：

1. Outcome 可衡量性梯度（per-outcome 定价的母变量）

Justin 的精炼：“核心是 outcome 是否可衡量，可定价”——这是 per-outcome 模式能否 work 的唯一母变量。

我拆出的四档梯度：

干净可数：客服 ticket、code PR merged、数据抽取条数、booked meeting → per-outcome 天然成立
可数但归因难：法律 memo、医疗诊断建议、销售邮件回复率 → 需要混合定价
outcome 本身是判断：战略建议、研究报告、设计稿 → per-outcome 走不通，要么 per-seat 要么 per-project
过程价值 > 结果价值：陪伴、教练、思考伙伴 → 保持 per-seat

推论：Agent 吃的第一波肉在上半段（接近 BPO 定价），下半段（接近咨询/创意定价）per-seat 保留很久。

2. Founder 跨范式判断锚

Justin 的观点（比作者原文更锋利）：

“旧公司能不能跨范式，核心在 Founder 意识——能不能本质上深刻理解新范式、用第一性原理重读自己，放弃 winner pattern。Anthropic 直接出 CLI 是非常强的点，完全放弃了自己的交互逻辑和壁垒。”

可操作化：看 Founder 有没有主动放弃自己最强路径依赖的具体动作，不是看嘴上怎么讲。

我补充的校准锚：Anthropic 敢放弃交互壁垒，部分原因是它本来没多少可放弃的。真正考验是 Adobe（Shantanu Narayen 砍盒装成功）、Figma（最近 AI 战略偏保守，在”保护画布范式”和”为 Agent 重开一条线”间选了前者）、Salesforce。有巨大既得交互资产的公司敢不敢从头重写，才是 self-disruption 的真测试场。

3. CLI 降级 GUI 的两条反向张力（Justin 立场测试后的补充）

Justin 立场：比作者更激进——“能用 CC 就不用 GUI，尤其网页，希望所有服务都有 CLI”。

需要对冲的反向张力：

探索性任务 GUI 不会输：CLI 适合知道自己要什么的任务；不知道该问什么问题时，好的仪表板会帮你生成问题（pre-attentive processing）。monitoring / data exploration 首屏 GUI 优势
CLI 是单人界面：没有”共识面”。多人协作、跨角色对齐时 GUI 是不可替代的共同注视点。Notion / Linear 这类协作层 GUI 短期死不了

4. To Agent 公司尽调草稿框架

Justin 诚实承认没想过这个问题，我给的草稿：

核心转变：To Human 尽调 = 理解用户 + 理解分发；To Agent 尽调 = 理解 API consumer + 理解生态位置。

三个维度（按权重）：

技术尽调权重 20%→60%：API 设计哲学（Agent-first vs human-first 翻译）、benchmark 可复现（P50/P99）、经济模型（单位成本曲线）
生态位置尽调：这家是 Agent 调用链条的哪一跳？会不会被 Anthropic/OpenAI managed harness 原生吞掉？有没有 state/data/trust 三类护城河中的至少一个？
团队尽调：Founder 有没有自己用 curl 调过自家 API？内部 dogfooding 用不用自家 Agent？

估值三档：

混合 B/C+Agent：ARR × 倍数，但 Agent-driven 部分占比高则调高倍数
接近纯 Agent consumer（80%+）：云基建估值模型，call volume × take rate × 锁定系数，PS 10-20x
纯 Agent infrastructure：看生态位独占性，不看收入。前 2 名吃 80%

5. 模型公司能力边界 rubric（Justin 的反问重构 —— 今日讨论最硬的 primitive）

Justin 的反问：

“模型公司比 OpenAI 或 Anthropic 都有最多的人力和钱和资源和生态优势去做每一层东西。所以真正的问题是模型公司不会做什么、什么事情他们做不好——这个是最核心的点。”

这个重构把机会地图和对手地图做成了同一张图。模型公司结构性做不好（不是暂时没做）的事情清单：

基因层面做不好：

深度行业 know-how + 线下客户关系（10 年起步的关系网，不是工程问题）
受监管数据的深度合规（HIPAA/GDPR/FINRA vertical 专属 pre-audit）
长尾系统整合（10,000 个小众 SaaS 的 OAuth 怪癖、legacy ERP SOAP、政府门户验证码）
物理世界/线下触达（RPA 跨系统点击、电话呼叫、现场巡检、文档扫描）

战略层面不会做：

反垄断敏感的 Orchestration（模型公司做 Agent Identity/Payment 会引来监管，给中立第三方窗口——Plaid 效应）
中立性要求的协议层（Agent 之间通信、跨模型 Orchestration，必须中立方托管）
低毛利运营生意（BPO、人工审核、定制实施，模型公司毛利率看不上）

时间窗口做不到：

客户信任积累（受监管行业 3-5 年信任周期）
专有数据飞轮（Healthcare 临床数据、Legal 判例注释）

用这张地图反校验作者三层：

Runtime：模型公司做得最快（Anthropic Code Execution Tool / OpenAI Assistants Runtime）——通用 Runtime 最危险
Vertical Harness：命中”行业 know-how + 合规 + 长尾整合”三条——最肥，护城河最稳
Orchestration Identity/Payment：命中”反垄断敏感 + 协议中立性”——最性感且有窗口，但需要协议判断力

这是一个可迭代的 rubric——每看一个 AI infra deal 过一遍：“模型公司做这件事有哪条基因/战略/时间障碍？” 没有任何障碍的赛道 = 大概率被吞。

本次讨论未展开的 knowledge gap（可选研究方向）

Vertical Harness 具体赛道深扫：Tax & Compliance、Construction Estimating 这两个 sleeper vertical 的现有玩家 + 进入壁垒
A2A / MCP / ACP 协议战争现状：哪个协议在聚拢生态、哪个在裂变、Anthropic 和 OpenAI 的协议立场
Anthropic 组织代谢信号监测：如何提前识别 Dario 团队能否完成从”模型公司 → 云平台公司”的第二曲线

（以上不自动升级研究，等 Justin 主动触发）