拾象 AGI 备忘录 Vol.1:高价值任务为什么成了所有 AI Labs 的 T0 战略
四人对谈(Penny / Cage / Feihong / Siqi),录于 2026 年 3 月下旬,拾象团队从湾区和北京连线。
Whole picture
核心判断两个字:收敛。过去一年大家还在用”ToC/ToB 二分”、“Anthropic vs OpenAI 路线不同”划 Labs 竞争格局,这篇说这套框架已经死了——所有 Labs 的 T0 都是”高价值任务”(端到端 take action、长周期、高单位智能消耗、高单位产出)。Anthropic 的 ARR 三个月从 ~90 亿翻到 ~300 亿反超 OpenAI 是结果不是原因,原因是 Opus 4.5 的 one-shot 能力 + Claude Code Harness 这两件事同时成熟。
文章 6 章顺着”战略变化 → 价值公式变化 → 硬件背书(NVDA 25/80 拆分)→ 算力侧卡位(VC 投芯片)→ 结构拐点(80% token ≠ 80% spending)“这条链展开。
逐段重点
§1 硅谷正在集体经历 “Move 37 时刻”
- AI 工程师亲手写代码比例从 70-80% 掉到 <5%,很多人不再打开编辑器
- 二级市场口径:去年讲 5-20% copilot 提效,今年 80%+ 代码由 agent 完成
- AI research 本身也半自动化,dirty work 全被 AI 接管,self-improving 闭环
- 触发剂:Opus 4.5 的 one-shot 能力 + Claude Code Harness 进化
- Harness 定义:“给 agent 搭一套上班需要的 Infra”
- 文中点名 OpenClaw “是一套很好的 Harness,下一步会往操作系统方向走”
§2 高价值任务 = 所有 Labs 的 T0
- Anthropic ARR:2025 年底 ~90 亿 → 2026 年 4 月初 ~300 亿(3 个月翻 3 倍),反超 OpenAI ~250 亿
- 关键不是”获取信息”而是”端到端 take action”
- 高价值任务画像:高智力门槛 + 高单位智能消耗 + 高单位产出(法律、金融、coding)
- 社会结构警告:美国是梨形结构,中产被替代后走向不稳定
§3 ToC / ToB 二分法是互联网时代的旧地图
- Claude Code 用户数 ≈ ChatGPT 的 1/20,ARR 已持平甚至反超
- 价值公式:DAU × ARPU → Token 消耗 × 任务单价
- SaaS 按 seat 定价 → 按 outcome 定价;B 端从买”信息系统”变成雇”劳动力”
- Agent 时代 C/B 边界模糊(founder 雇 100 个 agent,既是 B 也是 C)
§4 NVDA 的 25/80 拆分(GTC 2026)
- 老黄给”高价值任务”的定义:agent 独立完成 + 长周期 + 吐大量 token
- 路线 bet:让最好的模型做试错(不是用小模型反复试),所以需要 LPU 提升 latency 和并发
- 四档卡均分 25%,最高价值的那 25% 用 GPU + Grok LPU,1/4 的卡产出 80% 收入
- 真正的 implication:这是对”高价值任务 = 顶尖模型 + 最快硬件”做了物理层面的背书。拐点 = 平价模型追到够用阈值的那天
§5 “只投软件”的硅谷也开始投芯片了
- 二三十年罕见,多家机构同时投硬件
- Cerebras / Grok 都用 SRAM(替代 HBM),适合推理时大量中间数据
- Multi-agent 对硬件的三个新要求:
- context 处理能力(拆分避免长上下文 decay)
- 单次推理速度(再推高 5-10 倍)
- agent 间数据 throughput
§6 80% token ≠ 80% spending
- 两条路线并行:老黄向上拉硬件 vs OpenClaw 让平价模型够到上限
- 对 OpenClaw 的评价:好 ideas,但离生产级有 gap;最终拼工程能力还是”离模型最近的人”
- Multi-agent 本质 = 管理学问题,不是算法问题,像大厂赛马
- Multi-agent 里真正值钱的是 planner agent,不是 execution agent
- 二八结构稳定的前提:顶尖模型在 planner 位置始终拉得开差距;一旦平价模型跨过够用阈值,顶尖模型就从”80% spending 区”滑到”80% token 区”
亮点 / 槽点
亮点
- §3 点 16 的价值公式(DAU×ARPU → Token × 任务单价)是全篇最锋利的一刀,适合进 mental-models 作为”SaaS → Agent 定价迁移”的元框架
- §6 点 33+34+35 三连击(管理学 / planner 值钱 / 拐点条件)是一个完整模型
- §4 点 24 的”物理层面背书”推导很聪明:NVDA 的 25/80 拆分 = 给”顶尖模型有结构性定价权”做硬件背书,拐点 = 硬件优势被别的路径吃掉的那天
槽点 / 要小心
- ARR 数据全是 run rate 口径,不是 GAAP 收入。三个月翻 3 倍有一部分可能是 forward commits / bookings 放进来——要打折读
- “LPU / LPUX / LPGU” 三个名字混用,整理赶时间,这类细节不转述
- OpenClaw 被点名 3 次,褒贬混杂——需要自己下判断(见讨论补充)
- 文章录于 Opus 4.7 + Claude Design 发布当天,有明显的 Anthropic-centric 偏向
- “最后一代白领”是修辞。严谨论证需要 task-level automation rate × adoption speed × 价格下降曲线三条线交叉,文章没给
Discussion 补充(2026-04-21)
Justin 的核心观点
对 OpenClaw 的判断:机会渺茫,是”idea 很好的现象级产品,大概率昙花一现”。先发优势能带动一波生态,但 OpenClaw 锁不住生态价值——其他 agent 或大厂都能吃到生态红利。
真正的担心:Claude 自己下场做 horizontal harness,“让自己做所有 agent 的调度大脑”。这不是会不会发生的问题,而是迟早的事。
vertical vs horizontal 的判断:不下谁赢结论,走着瞧。当下押的是”短期 Claude 不会对其他家模型提供足量适配和支持”,这给跨模型 horizontal harness 留了一个窗口,但窗口很窄。
Claude 的补充观察
Anthropic 已经在做 horizontal harness,只是没打旗号。过去 6 个月的动作拼起来看:
| 动作 | 实际是什么 |
|---|---|
| Claude Code 的 sub-agent + Task tool | planner/executor 分层的官方实现 |
| Skills 系统 | 用户可注入的工作流插件机制 |
| MCP 协议 + marketplace | 跨工具 / 跨模型的调度抽象层 |
| Agent SDK(Python/TS) | Claude Code harness 被抽出来做成库,model-agnostic |
| Claude Design | 给非 Claude 产品调度多模态生成资产 |
这 5 件事合起来 = “Claude Agent Platform”,本质就是 horizontal harness。
OpenClaw 的控制点问题:Anthropic 控制模型能力(刷新频率最快)、协议(MCP 变事实标准)、分发(Claude Code 在哪标准就在哪)。OpenClaw 当下答不上来自己控制什么——这是锁不住生态的根因。
位置 A(跨模型瑞士)的时间窗:
- 0-6 个月:大(Agent SDK 能跑 GPT/Gemini 但文档/case study 全是 Claude)
- 6-18 个月:中(Claude 若在 coding 继续第一,不会下场)
- 18 个月+:窗口关闭(若 Gemini 3 / GPT-6 追平,Anthropic 也得转型成 model-agnostic orchestrator 保平台地位,逻辑同 AWS 当年)
赛道已挤满:Portkey、OpenRouter、LiteLLM、Vercel AI SDK、Langfuse、Cline、Aider、Roo Code、LangGraph、CrewAI。OpenClaw 在 horizontal 赛道不是先发,是后发 + 品类模糊。
达成共识
- OpenClaw 的归宿大概率是”idea 很好的开源代表”,昙花一现
- 真正的 horizontal harness 位置被 Anthropic 隐式占据中
- 值得持续观察的信号:Anthropic 什么时候把 Agent SDK 的”跨模型”从能跑变成”官方支持 + 文档 + case study”,那一刻就是 horizontal harness 位置落锤的时候
可沉淀的 mental model 候选
以下几条来自原文 + 讨论,Justin 确认后进 mental-models:
- 价值公式迁移:DAU × ARPU → Token 消耗 × 任务单价(§3 点 16)
- Multi-agent ≈ 管理学 + 大厂赛马(§6 点 33)
- Planner > Executor(§6 点 34)
- 顶尖模型定价权 = f(平价模型未跨过够用阈值)(§6 点 35)
- Horizontal harness 的控制点三元组:模型能力、协议、分发(讨论补充)
Knowledge-gap 检查
讨论里 Justin 主动收束话题(“走着瞧”),未出现”反面观点缺失 / 关键证据没看到”的 gap。不建议升级 research。