Agent 时代启示录:当 Agent 作为新物种加入经济系统
Whole picture
拾象(Cage)提出的核心论点:衡量对象变了,互联网时代的分析框架(DAU/MAU、To B/To C、per-seat 定价、IT 预算锚)在 Agent 时代整体失效。真正的新坐标不是 To B/To C,而是 To Human / To Agent。
文章从现象(指标失效、软件被重写、旧范式熊市)推到概念(Agent 作为新物种加入经济系统),再到战略层(Agent = Model + Harness,Anthropic Managed Agents 的平台化意义),最后落到三个看好方向:Runtime(Agent Infra)、Context(Vertical Harness)、Orchestration(Agent Identity / Payment,“Agent 版 Plaid”)。
段 1 · 旧尺度在失效
作者论点:
- Anthropic DAU < OpenAI 2%,但 ARR 追平(2026-03 年化 300 亿,同比 1400%)——价值集中在头部 token-heavy 任务,不在用户规模
- 付费从 per-seat → per-outcome(Decagon resolution 模型、Sierra “pay for a job well done”)
- 定价锚点从 IT 预算(千亿)迁移到人力成本池(全球白领工资 18-20 万亿美金,差 1-2 个数量级)
- Prosumer 让 B/C 分类失灵——Claude Code / Cursor / Perplexity / Manus 工程师自购
我的解读:
- 最硬的 primitive 是锚点迁移——vertical AI 的 TAM 算法要重写:不再用”行业 SaaS 市场多大”算,而是用”职能全球工资总额 × 可替代比例 × take rate”算
- 潜台词:per-outcome 只在 outcome 可测量、可归因时成立。客服 ticket、code PR 可测量;战略 memo、创意设计难测量
段 2 · 软件正在被重写
作者论点:
- 软件从设计之初 To Human;Agent 不需要 GUI、不需要人类认知负担抽象
- 格式迁移:GUI→CLI/API、可视化→结构化数据、人类文档→机器可读 schema
- Claude Code 选 CLI 是早期信号——“bash is everything for coding agents”
- 未来软件 = Model + Agent Harness + 按需生成的人类审阅层;下一代 Salesforce 不是 CRM,是 Agent 可读写的客户数据语义层
我的解读:
- GUI 不会消失,但会从”应用主体”降级为”Agent 输出的临时渲染层”。人类只在决策点看
- 投资信号:谁把存量 SaaS 的数据层 Agent-native 化,谁就有机会切 Salesforce/Adobe/ServiceNow(关键词:语义层)
- 作者漏讲的维度:内容侧也要有 To Agent 版本。llms.txt 是苗头,远不够
段 3 · 旧范式的漫长熊市
作者论点:
- 每次平台迁移都是新范式原生公司赢(雅虎→Google、诺基亚→iPhone)
- 原因是旧范式的 winner pattern 在 DNA 层面互斥新范式
- OpenAI 8 亿用户是战略包袱不是资产;Anthropic 没这个包袱
我的反驳:
- 作者选择性引用了成功替代案例,跳过反例:Microsoft(本地→SaaS 成功)、Adobe(盒装→订阅云成功)、AWS(电商内部衍生)
- 真规律不是”新玩家必赢”,是有组织代谢能力的公司能跨范式。Adobe 换得过去是 CEO Shantanu Narayen 主动砍了盒装业务
- “8 亿用户是包袱”这个论断暴露了论证不够硬——ChatGPT 付费订阅约 60-80 亿 ARR 不会主动放弃。更准确的说法是”OpenAI 同时打两场战争,每条战线都做不到最纯粹”
- 作者自己找补”OpenAI 综合实力最强之一”、Sam 最近降 ChatGPT 优先级——这恰是立论反证
段 4 · To Agent:新物种加入经济系统
作者论点(全文价值承重墙):
- 生产侧已发生:Anthropic 52 天发 70+ features(Agent 写 / 测 / 部署);OpenAI Codex “no manual code”
- 消费侧正被基建化:Stripe Machine Payments Protocol、Cloudflare AI bot 分类——Agent 作为第一公民设计
- 闭环形成:Agent 写的 feature 被 Agent 调用、Agent 生成的数据被 Agent 消费、Agent 的采购由 Agent API 承接
- “人类经济史上从未出现过:生产者和消费者同时是非人类的双边市场”
我的解读:
- “Agent 是第一公民”是一个投资筛子:问”它把 Agent 作为 afterthought 还是 primary user”,能把装腔作势的”AI-ready”产品筛掉
- 作者没讲的暗礁——Agent 消费者需求结构和人类不同:
- 延迟敏感性低(容忍长延迟只要结果对)
- 价格敏感度极高(单次调用 0.1 美分都影响选型)
- 信任靠 benchmark/SLA/API 稳定性,不靠品牌
- 锁定靠状态/数据/生态,不靠 UI 肌肉记忆
- 推论:To Agent 市场虽然 TAM 巨大,但竞争逻辑接近纯 commodity,只有 state/context 平台级锁定能拿溢价
- 系统性风险:作者只讲闭环效率没讲闭环脆弱性——Agent 写 bug → Agent 调用 bug API → Agent 生产错误数据 → Agent 依赖错误数据决策。金融市场见过类似(算法交易闪崩)。可能需要”熔断机制”基建层
段 5 · Agent = Model + Harness
作者论点:
- Harness = Agent 除模型外的所有组件(context、tool、memory、runtime、skills)
- Anthropic 2026-04 发布 Managed Agents beta——战略意义大于技术意义
- 商业模式从 token 定价 → AWS 云平台模式;切换成本从”改几行代码”变成”重建整个 AI workflow”
- LLM 公司第一次有了护城河
- 反直觉事实:2026 最好的 Harness 比 LangChain 薄得多(Opus 4.5 越过 Agentic 拐点后,越薄越强;Claude Code 核心 Agent Loop 只有几十行)
我的解读:
- 颠覆 VC 共识:过去两年流行叙事是”模型层 commodity、应用层吃价值”。Managed Agents 叙事成立 = 模型公司通过 harness 向上游吃应用层。Cursor/Cline/Devin 这类 harness 公司价值被压薄
- “薄化”和”Managed”表面矛盾实则互为因果:正因为 harness 从 LangChain 重工程退化到几十行,Anthropic 才敢产品化
- 关键暗线:Harness
薄化是闭源模型公司的专属红利,不是普惠
- 闭源(Anthropic、OpenAI):薄 harness 是”贴合模型性格的贴身衣”,能锁在自己这边
- 开源(Llama、Qwen、DeepSeek):薄 harness 更难建立上层粘性,因为能被任何人 fork
- 推论:第三方 agent harness 创业公司估值长期被吞,只有深度 vertical 的 harness 能活
- Anthropic 的第二曲线挑战:从”卖智能”→“卖服务”,毛利率下降 + 研发精力分散。Dario 需要一次组织代谢,比 Sam 砍消费产品优先级更难——Sam 砍的是包袱,Dario 要加的是运营复杂度
段 6 · 拾象看好的三个方向
作者三层机会地图:
- Runtime 层(Agent Infra):per-agent 状态隔离、Fork/Snapshot、Durable Execution、临时 DB/VM
- Context 层(Vertical Harness):Healthcare / Legal / Finance 优先,OpenEvidence / Rogo / Sierra 为早期样本
- Orchestration 层:Agent Identity(身份证 + 工作许可)、Agent Payment(Stripe MPP 协议层 + “Agent 版 Plaid”的应用层)
我的评价(信号强度参差):
- Runtime 层:需求真实但赛道已挤(E2B / Modal / Daytona / Cloudflare Containers + Anthropic 自家 Code Execution Tool)。通用 Runtime 大概率被模型公司吞。能活的是 Anthropic/OpenAI 不愿意做的 runtime——企业内网、特殊合规、异构计算
- Context 层 / Vertical
Harness:最肥,护城河最稳。对接段 5
薄化红利反向推论——通用 harness 被吞,vertical harness 靠行业 know-how +
专有数据 + 客户关系立足
- 作者名单外补充两个 sleeper:Tax & Compliance、Construction / Industrial Estimating(中美少人做)
- Orchestration 层:最性感但最难下手
- “Agent 版 Plaid”类比的坑:Stripe 不像传统银行那么僵化,可能自己做 Plaid 层
- Agent Identity 比 Payment 更早期,是赌协议战争赢家
- 建议:小额早期押赛道,1-2 年协议稳定后再 double down
- 作者遗漏:完全没提 Agent-to-Agent 通信协议(A2A、MCP、ACP)。这一层未来会出现”TCP/IP 时刻”
Discussion 补充(2026-04-22)
今日讨论产出的几个 primitive 和新判断:
1. Outcome 可衡量性梯度(per-outcome 定价的母变量)
Justin 的精炼:“核心是 outcome 是否可衡量,可定价”——这是 per-outcome 模式能否 work 的唯一母变量。
我拆出的四档梯度:
- 干净可数:客服 ticket、code PR merged、数据抽取条数、booked meeting → per-outcome 天然成立
- 可数但归因难:法律 memo、医疗诊断建议、销售邮件回复率 → 需要混合定价
- outcome 本身是判断:战略建议、研究报告、设计稿 → per-outcome 走不通,要么 per-seat 要么 per-project
- 过程价值 > 结果价值:陪伴、教练、思考伙伴 → 保持 per-seat
推论:Agent 吃的第一波肉在上半段(接近 BPO 定价),下半段(接近咨询/创意定价)per-seat 保留很久。
2. Founder 跨范式判断锚
Justin 的观点(比作者原文更锋利):
“旧公司能不能跨范式,核心在 Founder 意识——能不能本质上深刻理解新范式、用第一性原理重读自己,放弃 winner pattern。Anthropic 直接出 CLI 是非常强的点,完全放弃了自己的交互逻辑和壁垒。”
可操作化:看 Founder 有没有主动放弃自己最强路径依赖的具体动作,不是看嘴上怎么讲。
我补充的校准锚:Anthropic 敢放弃交互壁垒,部分原因是它本来没多少可放弃的。真正考验是 Adobe(Shantanu Narayen 砍盒装成功)、Figma(最近 AI 战略偏保守,在”保护画布范式”和”为 Agent 重开一条线”间选了前者)、Salesforce。有巨大既得交互资产的公司敢不敢从头重写,才是 self-disruption 的真测试场。
3. CLI 降级 GUI 的两条反向张力(Justin 立场测试后的补充)
Justin 立场:比作者更激进——“能用 CC 就不用 GUI,尤其网页,希望所有服务都有 CLI”。
需要对冲的反向张力:
- 探索性任务 GUI 不会输:CLI 适合知道自己要什么的任务;不知道该问什么问题时,好的仪表板会帮你生成问题(pre-attentive processing)。monitoring / data exploration 首屏 GUI 优势
- CLI 是单人界面:没有”共识面”。多人协作、跨角色对齐时 GUI 是不可替代的共同注视点。Notion / Linear 这类协作层 GUI 短期死不了
4. To Agent 公司尽调草稿框架
Justin 诚实承认没想过这个问题,我给的草稿:
核心转变:To Human 尽调 = 理解用户 + 理解分发;To Agent 尽调 = 理解 API consumer + 理解生态位置。
三个维度(按权重):
- 技术尽调权重 20%→60%:API 设计哲学(Agent-first vs human-first 翻译)、benchmark 可复现(P50/P99)、经济模型(单位成本曲线)
- 生态位置尽调:这家是 Agent 调用链条的哪一跳?会不会被 Anthropic/OpenAI managed harness 原生吞掉?有没有 state/data/trust 三类护城河中的至少一个?
- 团队尽调:Founder 有没有自己用 curl 调过自家 API?内部 dogfooding 用不用自家 Agent?
估值三档:
- 混合 B/C+Agent:ARR × 倍数,但 Agent-driven 部分占比高则调高倍数
- 接近纯 Agent consumer(80%+):云基建估值模型,call volume × take rate × 锁定系数,PS 10-20x
- 纯 Agent infrastructure:看生态位独占性,不看收入。前 2 名吃 80%
5. 模型公司能力边界 rubric(Justin 的反问重构 —— 今日讨论最硬的 primitive)
Justin 的反问:
“模型公司比 OpenAI 或 Anthropic 都有最多的人力和钱和资源和生态优势去做每一层东西。所以真正的问题是模型公司不会做什么、什么事情他们做不好——这个是最核心的点。”
这个重构把机会地图和对手地图做成了同一张图。模型公司结构性做不好(不是暂时没做)的事情清单:
基因层面做不好:
- 深度行业 know-how + 线下客户关系(10 年起步的关系网,不是工程问题)
- 受监管数据的深度合规(HIPAA/GDPR/FINRA vertical 专属 pre-audit)
- 长尾系统整合(10,000 个小众 SaaS 的 OAuth 怪癖、legacy ERP SOAP、政府门户验证码)
- 物理世界/线下触达(RPA 跨系统点击、电话呼叫、现场巡检、文档扫描)
战略层面不会做:
- 反垄断敏感的 Orchestration(模型公司做 Agent Identity/Payment 会引来监管,给中立第三方窗口——Plaid 效应)
- 中立性要求的协议层(Agent 之间通信、跨模型 Orchestration,必须中立方托管)
- 低毛利运营生意(BPO、人工审核、定制实施,模型公司毛利率看不上)
时间窗口做不到:
- 客户信任积累(受监管行业 3-5 年信任周期)
- 专有数据飞轮(Healthcare 临床数据、Legal 判例注释)
用这张地图反校验作者三层:
- Runtime:模型公司做得最快(Anthropic Code Execution Tool / OpenAI Assistants Runtime)——通用 Runtime 最危险
- Vertical Harness:命中”行业 know-how + 合规 + 长尾整合”三条——最肥,护城河最稳
- Orchestration Identity/Payment:命中”反垄断敏感 + 协议中立性”——最性感且有窗口,但需要协议判断力
这是一个可迭代的 rubric——每看一个 AI infra deal 过一遍:“模型公司做这件事有哪条基因/战略/时间障碍?” 没有任何障碍的赛道 = 大概率被吞。
本次讨论未展开的 knowledge gap(可选研究方向)
- Vertical Harness 具体赛道深扫:Tax & Compliance、Construction Estimating 这两个 sleeper vertical 的现有玩家 + 进入壁垒
- A2A / MCP / ACP 协议战争现状:哪个协议在聚拢生态、哪个在裂变、Anthropic 和 OpenAI 的协议立场
- Anthropic 组织代谢信号监测:如何提前识别 Dario 团队能否完成从”模型公司 → 云平台公司”的第二曲线
(以上不自动升级研究,等 Justin 主动触发)