拾象 AGI 备忘录 Vol.1：高价值任务为什么成了所有 AI Labs 的 T0 战略

拾象 / 海外独角兽（Penny、Cage、Feihong、Siqi） · Original

四人对谈（Penny / Cage / Feihong / Siqi），录于 2026 年 3 月下旬，拾象团队从湾区和北京连线。

Whole picture

核心判断两个字：收敛。过去一年大家还在用”ToC/ToB 二分”、“Anthropic vs OpenAI 路线不同”划 Labs 竞争格局，这篇说这套框架已经死了——所有 Labs 的 T0 都是”高价值任务”（端到端 take action、长周期、高单位智能消耗、高单位产出）。Anthropic 的 ARR 三个月从 ~90 亿翻到 ~300 亿反超 OpenAI 是结果不是原因，原因是 Opus 4.5 的 one-shot 能力 + Claude Code Harness 这两件事同时成熟。

文章 6 章顺着”战略变化 → 价值公式变化 → 硬件背书（NVDA 25/80 拆分）→ 算力侧卡位（VC 投芯片）→ 结构拐点（80% token ≠ 80% spending）“这条链展开。

逐段重点

§1 硅谷正在集体经历 “Move 37 时刻”

AI 工程师亲手写代码比例从 70-80% 掉到 <5%，很多人不再打开编辑器
二级市场口径：去年讲 5-20% copilot 提效，今年 80%+ 代码由 agent 完成
AI research 本身也半自动化，dirty work 全被 AI 接管，self-improving 闭环
触发剂：Opus 4.5 的 one-shot 能力 + Claude Code Harness 进化
Harness 定义：“给 agent 搭一套上班需要的 Infra”
文中点名 OpenClaw “是一套很好的 Harness，下一步会往操作系统方向走”

§2 高价值任务 = 所有 Labs 的 T0

Anthropic ARR：2025 年底 ~90 亿 → 2026 年 4 月初 ~300 亿（3 个月翻 3 倍），反超 OpenAI ~250 亿
关键不是”获取信息”而是”端到端 take action”
高价值任务画像：高智力门槛 + 高单位智能消耗 + 高单位产出（法律、金融、coding）
社会结构警告：美国是梨形结构，中产被替代后走向不稳定

§3 ToC / ToB 二分法是互联网时代的旧地图

Claude Code 用户数 ≈ ChatGPT 的 1/20，ARR 已持平甚至反超
价值公式：DAU × ARPU → Token 消耗 × 任务单价
SaaS 按 seat 定价 → 按 outcome 定价；B 端从买”信息系统”变成雇”劳动力”
Agent 时代 C/B 边界模糊（founder 雇 100 个 agent，既是 B 也是 C）

§4 NVDA 的 25/80 拆分（GTC 2026）

老黄给”高价值任务”的定义：agent 独立完成 + 长周期 + 吐大量 token
路线 bet：让最好的模型做试错（不是用小模型反复试），所以需要 LPU 提升 latency 和并发
四档卡均分 25%，最高价值的那 25% 用 GPU + Grok LPU，1/4 的卡产出 80% 收入
真正的 implication：这是对”高价值任务 = 顶尖模型 + 最快硬件”做了物理层面的背书。拐点 = 平价模型追到够用阈值的那天

§5 “只投软件”的硅谷也开始投芯片了

二三十年罕见，多家机构同时投硬件
Cerebras / Grok 都用 SRAM（替代 HBM），适合推理时大量中间数据
Multi-agent 对硬件的三个新要求：
- context 处理能力（拆分避免长上下文 decay）
- 单次推理速度（再推高 5-10 倍）
- agent 间数据 throughput

§6 80% token ≠ 80% spending

两条路线并行：老黄向上拉硬件 vs OpenClaw 让平价模型够到上限
对 OpenClaw 的评价：好 ideas，但离生产级有 gap；最终拼工程能力还是”离模型最近的人”
Multi-agent 本质 = 管理学问题，不是算法问题，像大厂赛马
Multi-agent 里真正值钱的是 planner agent，不是 execution agent
二八结构稳定的前提：顶尖模型在 planner 位置始终拉得开差距；一旦平价模型跨过够用阈值，顶尖模型就从”80% spending 区”滑到”80% token 区”

亮点 / 槽点

亮点

§3 点 16 的价值公式（DAU×ARPU → Token × 任务单价）是全篇最锋利的一刀，适合进 mental-models 作为”SaaS → Agent 定价迁移”的元框架
§6 点 33+34+35 三连击（管理学 / planner 值钱 / 拐点条件）是一个完整模型
§4 点 24 的”物理层面背书”推导很聪明：NVDA 的 25/80 拆分 = 给”顶尖模型有结构性定价权”做硬件背书，拐点 = 硬件优势被别的路径吃掉的那天

槽点 / 要小心

ARR 数据全是 run rate 口径，不是 GAAP 收入。三个月翻 3 倍有一部分可能是 forward commits / bookings 放进来——要打折读
“LPU / LPUX / LPGU” 三个名字混用，整理赶时间，这类细节不转述
OpenClaw 被点名 3 次，褒贬混杂——需要自己下判断（见讨论补充）
文章录于 Opus 4.7 + Claude Design 发布当天，有明显的 Anthropic-centric 偏向
“最后一代白领”是修辞。严谨论证需要 task-level automation rate × adoption speed × 价格下降曲线三条线交叉，文章没给

Discussion 补充（2026-04-21）

Justin 的核心观点

对 OpenClaw 的判断：机会渺茫，是”idea 很好的现象级产品，大概率昙花一现”。先发优势能带动一波生态，但 OpenClaw 锁不住生态价值——其他 agent 或大厂都能吃到生态红利。

真正的担心：Claude 自己下场做 horizontal harness，“让自己做所有 agent 的调度大脑”。这不是会不会发生的问题，而是迟早的事。

vertical vs horizontal 的判断：不下谁赢结论，走着瞧。当下押的是”短期 Claude 不会对其他家模型提供足量适配和支持”，这给跨模型 horizontal harness 留了一个窗口，但窗口很窄。

Claude 的补充观察

Anthropic 已经在做 horizontal harness，只是没打旗号。过去 6 个月的动作拼起来看：

动作	实际是什么
Claude Code 的 sub-agent + Task tool	planner/executor 分层的官方实现
Skills 系统	用户可注入的工作流插件机制
MCP 协议 + marketplace	跨工具 / 跨模型的调度抽象层
Agent SDK（Python/TS）	Claude Code harness 被抽出来做成库，model-agnostic
Claude Design	给非 Claude 产品调度多模态生成资产

这 5 件事合起来 = “Claude Agent Platform”，本质就是 horizontal harness。

OpenClaw 的控制点问题：Anthropic 控制模型能力（刷新频率最快）、协议（MCP 变事实标准）、分发（Claude Code 在哪标准就在哪）。OpenClaw 当下答不上来自己控制什么——这是锁不住生态的根因。

位置 A（跨模型瑞士）的时间窗：

0-6 个月：大（Agent SDK 能跑 GPT/Gemini 但文档/case study 全是 Claude）
6-18 个月：中（Claude 若在 coding 继续第一，不会下场）
18 个月+：窗口关闭（若 Gemini 3 / GPT-6 追平，Anthropic 也得转型成 model-agnostic orchestrator 保平台地位，逻辑同 AWS 当年）

赛道已挤满：Portkey、OpenRouter、LiteLLM、Vercel AI SDK、Langfuse、Cline、Aider、Roo Code、LangGraph、CrewAI。OpenClaw 在 horizontal 赛道不是先发，是后发 + 品类模糊。

达成共识

OpenClaw 的归宿大概率是”idea 很好的开源代表”，昙花一现
真正的 horizontal harness 位置被 Anthropic 隐式占据中
值得持续观察的信号：Anthropic 什么时候把 Agent SDK 的”跨模型”从能跑变成”官方支持 + 文档 + case study”，那一刻就是 horizontal harness 位置落锤的时候

可沉淀的 mental model 候选

以下几条来自原文 + 讨论，Justin 确认后进 mental-models：

价值公式迁移：DAU × ARPU → Token 消耗 × 任务单价（§3 点 16）
Multi-agent ≈ 管理学 + 大厂赛马（§6 点 33）
Planner > Executor（§6 点 34）
顶尖模型定价权 = f(平价模型未跨过够用阈值)（§6 点 35）
Horizontal harness 的控制点三元组：模型能力、协议、分发（讨论补充）

Knowledge-gap 检查

讨论里 Justin 主动收束话题（“走着瞧”），未出现”反面观点缺失 / 关键证据没看到”的 gap。不建议升级 research。