精读 OpenAI《知识工作的下一个时代》——Codex 如何从写代码扩张到知识工作
受众:Justin(红杉中国 MD) 原文:OpenAI 官方报告,2026-06-02,11 页 PDF,全文英文 一句话定性:这是 OpenAI 的官方报告 + 软性宣传——主张 Codex 正在从”写代码工具”扩张成”知识工作的通用工具”,并借此向政策制定者喊话。数据全部来自 OpenAI 自己。 内容值得看(趋势判断和框架不错),但要按”厂商自述、利益相关方”打折。
下面按原文结构逐段讲清楚。
开篇数字(封面后第一页)
三个核心数字: - 500 万 Codex 周活用户 - >6 倍:自 2 月桌面 App 上线以来周活的增长 - >3 倍:知识工作者(非开发者)采用 Codex 的速度是开发者的 3 倍多
并点明知识工作者增长最快的三类任务:数据分析、研究、知识产出物(knowledge artifacts,指报告/备忘/合同这类文档成果)。
一、现代世界里的知识工作
知识工作已经主导发达经济体。 美国超过 40% 的劳动力(约 7200 万人)主要跟信息打交道——分析、代码、文档、设计、系统、决策、沟通。这是个晚近才发生的历史变化: - 1850 年:约 60% 的美国人务农 - 1970 年:务农降到约 4%,产出反而暴涨 - 制造业一度吸收了被替换的劳动力,1960 年占美国就业约 26% 的峰值,之后随全球化和机器人回落 - 知识工作填补了这块空间。“知识工作者”这个词是 Peter Drucker 1959 年造的,指主要输入输出是”符号”而非农作物/制成品的职业。现在涵盖软件、工程、科学、管理、教育、医疗、法律、金融、设计、营销、新闻、咨询和大部分公共行政。
一个反常的”丰裕”(strange abundance):现代人产出文档、消息、仪表盘、模型、演示的速度前所未有地快,但花在”找上下文、核对互相矛盾的版本、等回复、在系统间搬信息”上的时间也大得惊人。引麦肯锡全球研究院的研究:普通知识工作者每周约 28% 的工作时间在处理邮件,近 20% 在找内部信息或找能帮忙的同事。
根因是”零敲碎打的数字化”(piecemeal digitization):邮件让通信即时化,文档变协作,表格/仪表盘/工单系统/CRM/知识库/聊天工具/各种 SaaS 各自解决了一个局部问题,却留下一堆割裂的工具。我们需要的信息藏在收件箱、文件夹、聊天、评论、权限、仪表盘、工单、会议、还有我们自己的记忆里。“办公室数字化了,却没有被整合(digital without becoming integrated)”——这句是全文最精炼的诊断。
定义日常知识工作成本的三种摩擦(这个三分法值得记): 1. 搜索(search):在庞杂、不透明的系统里找到对的输入——对的文件、条款、路径、数据集、消息、专家,全都是大海捞针。 2. 协调(coordination):在团队、工具、格式之间搬动信息和决策,同时还要应付组织里互相分歧、不断变化的利益诉求。 3. 审批与验证(approval and verification):让成果被接受、并经得起现实检验。工程里是测试/评审/部署/持续监控;法律或咨询里是合伙人评审、客户验收、可辩护的论证;科学里是实验、复现、证据。
二、生产率悖论:为什么电脑进了办公室却没提升产出
这一段是全文理论骨架,借了两个经典: - Robert Solow 的观察:“计算机时代到处都看得见,唯独不在生产率统计里。” - Erik Brynjolfsson 给它起名叫 生产率悖论(productivity paradox),并提出更深的理论:信息技术只有在组织重新设计流程、技能、管理结构和工作流之后,才会带来大的收益。
电力的类比(这个类比是理解全文主张的钥匙):电力的大收益不是在工厂”用电动机替换蒸汽机”时出现的,而是在工厂停止把电当蒸汽的替代品、把厂房按”每台机器旁边一个分布式电动机”重新设计之后才出现——这花了几十年。
知识工作还在等它的”厂房重新设计”:过去几代办公软件降低了”生产中间产出物”的成本,却没降低”消化这些产出物所需的注意力”。邮件让通信变便宜,于是通信量翻倍;文档让起草变便宜,于是草稿和评审轮次翻倍。结果是产出物过剩、时间和注意力越来越稀缺。
三、“Codex 就是那次重新设计”
这是 OpenAI 的核心主张(也是软广点):工厂把电动机放到每台机器旁边,Codex 把 AI 放到每个待解决的问题旁边。
大组织过去是围绕”生产和搬运产出物的高成本”建起来的——秘书池、跨职能团队、文员金字塔、长长的评审链。Codex 把更多”自主权(agency)“交到最需要的人手上,在产出物生产的前、中、后都化解瓶颈:找输入、协调工作流、产出交付物、检查质量、追审批。主张是公司能更快、更少延迟和行政负担地运转,人能聚焦在最有影响的任务上。
案例 1 — GroundVue(创始人 Travis Hoppe、Ann Lewis、Shannon Arvizu):帮政府之间互相学习,把公开会议做成可大规模检索、可比较的内容。全美约 9 万个政府机构,关键信息散落在视频、网站、地方平台上。GroundVue 用 Codex 找到这些难触达的公开来源、持续采集整理。过去要几天几周的活现在几分钟,小团队干了过去要一大群技术员和研究员才能干的事——把碎片化的公共信息变成可用的机构知识。
四、越过软件边界:Codex 在知识工作里的扩张
Codex 现在 >500 万周活,自 2 月桌面 App 上线涨了 >6 倍。虽然起家是软件开发工具,但更快的增长来自更广的”知识工作”。 - 数据科学家用它清洗数据集、建模型、自动化分析 - 财务团队用它对账、做预测、生成报告 - 设计师用它做产品原型、出素材 - 营销用它分析活动、产内容、综合客户反馈
关键数据: - 知识工作者现在约占 Codex 用户 20%,采用速度是开发者的 3 倍多(涵盖产品/项目管理、设计、研究、学术) - 个人用户占 >5%,增速是开发者的 4 倍多(爱好/创作、教育/自学、个人理财、娱乐)
图:Codex 用户构成随时间变化——开发者占比从约 88% 一路降到约 74%;知识工作者升到约 20%;个人用户小幅上升。
最值得看的是知识工作者的任务结构(图:知识工作者每周任务渗透率): - 知识产出物 72% - 工程运维(engineering operations)47% - 代码实现(code implementation)46% - 应用管理 42% - 研究 41% - 代码理解 35% - 数据分析 27% - 协作 23% - 代码校验 16% - 业务职能工作流 15%
软件工作和知识工作的边界正在模糊:开发者用 Codex 做知识产出物,知识工作者用它写代码、做工程运维。产品经理自己搭仪表盘,而不是叫另一个团队做;研究员自己写数据清洗脚本,不走工程排期;设计师不等开发就把原型发出去;高管自己搭一个对账+周报的内部工具。“Codex 让离问题最近的人能自己把缺的工具造出来,不用等正式的软件路线图批准和交付。”——这句是全文对组织影响最关键的判断。
行为上最重大的变化:并行任务。 现在约 50% 的用户在一天里某个时点会同时跑不止一个 Codex 任务(4 月中旬还不到三分之一)。从串行到并行,让一个知识工作者能以一个小团队的规模运作:一个任务查数据集、一个起草脚本、一个拼报告、一个检查应用。用户从”一次执行一个任务”变成”多条工作流的编排者(orchestrator)“。
案例 2 — Proaction(联合创始人 Colin Knudsen):帮车队管理车辆和设备,数据散落在车联网系统、维保平台、表格和员工记忆里。用 Codex 把客户对话变成定制提案、工作流原型、可跑的演示——在签合同之前就能快速搭建并验证方案,而不是用通用销售话术。把客户发现、销售、产品开发串到一起,一个 5 人创业公司能打出远超体量的竞争力。
五、Codex 增长最快的地方
最快增长的三类任务(周环比):数据分析 +110%、研究 +37%、知识产出物 +36%。细节: - 知识产出物里最常处理文本文档(Google Docs/Word/报告/备忘/合同)和多媒体(图片/音频/视频),其中处理 PDF 和表格的用户增长 >50% - 研究里常见网页+内部知识检索,市场研究(公司、行业、竞品、市场规模和定位)增长显著 - 数据分析里”数据标注(data labeling)“占大头、增速也最快 - 还有 >40% 增长的一堆任务:起草消息、做产品设计、理解合同/法规/政策、招聘和面试
案例 3 — 数学教授 Taiyo Inoue(加州州立大学):用 Codex 自动化教学里最没成就感、最耗时的部分——在学习管理系统(Canvas)里维护课程信息。让 Codex 生成脚本去更新作业、日历、材料、公告,每周省 4-5 小时。省下的时间他把课重新设计成协作式解题,让学生更多地一起、面对面地做数学。
六、智能体时代的政策建议(OpenAI 向政策制定者喊话)
定调:给人们用上这些工具、并教会他们负责任地构建和委派的国家与组织,会获得最大的生产率收益。 Codex 不是知识工作者的替代品,而是让离问题最近的人拥有更多自主权和解决难题的能力。四条建议:
现代化工作流,并衡量真正有效的东西:公共机构应该用 agent 来减少行政积压、改善软件系统、检索和对账记录、支持科研、更快交付公共服务。成效要用老百姓看得懂的结果衡量——更短的等待、更少的表格、更快的审批、更好的福利发放、更低的行政成本。收益不该只归最大的公司,政策要支持学校、创业公司、小企业、非营利、研究者和政府的广泛可及。
把 AI 素养当成核心劳动力技能:政府应把 AI 素养当成基础经济设施,通过学校、社区大学、公共机构、图书馆资助动手培训;鼓励雇主用补贴、税收激励、采购、合作给员工带薪学习真实工作流的时间。
把工作者放在 AI 采用的中心:离工作最近的人最清楚 AI 在哪能让工作更好、更安全、更高效——护士知道哪些表格拖慢护理,社工知道福利发放在哪卡壳,机械师知道哪些交接出错,老师知道行政工作占了多少跟学生相处的时间。政府应通过小企业补助、公共部门创新基金、技术援助和正式渠道支持”工作者主导”的 AI 采用。回报最高的用途往往是本地的、具体的:诊所、实验室、地方政府办公室、小制造商或非营利的一个小工具。
围绕”要完成的工作”更新公共采购:政府应更新采购,让机构能买”解决运营问题的 AI 工具”,而不只是买软件许可证。公共部门试点要满足隐私、安全、可审计、人类监督;机构应被授权在安全沙箱里测试工具,并把”可衡量地减少积压、提升质量、降低行政负担”的东西规模化。
案例 4 — Luke Xing:用 Codex 做了个桌面 App,补偿他左耳严重且波动的听力损失。用大白话把问题描述给 Codex,做出一个跨频段测听力、为不同设备调整音频输出的工具,帮他在音乐、通话、日常听觉里恢复平衡。它不是医疗设备,是对一个非常具体、商业软件没覆盖的难题的个人解决方案。“人们不再需要等别人来造他们需要的工具——越来越多地,他们可以自己造。”
拧巴的地方 / 我的提醒
这是 OpenAI 自家报告,数据全是自报。 500 万周活、>6 倍增长、知识工作者 >3 倍采用速度、各任务渗透率和增速——全部来自 OpenAI 内部,没有第三方审计,定义(什么算”知识工作者”、什么算”一个任务”、“周活”口径)也没公开。方向可信(Codex 确实在向非开发者扩张),但具体数字别当硬数据引用。
“周环比增长”容易夸大。 数据分析 +110% WoW 这种数字,基数小的时候很容易冲得很高;单看周环比会高估稳态趋势。看绝对渗透率(数据分析才 27%)比看增速更靠谱。
四个案例都是精选的成功故事(幸存者)。 GroundVue、Proaction、Taiyo Inoue、Luke Xing 都是正面样本,没有任何”用了没效果/翻车”的对照。case 是用来佐证叙事的,不是中立证据。
电力类比很漂亮,但 OpenAI 把自己直接放进”那次厂房重新设计”的位置——这是论证里最大的一跳。 电力的收益花了几十年、靠的是组织重构而不只是工具;报告承认这点,却又暗示 Codex 已经是答案。更稳的读法是:Codex 是这次重构的一个候选工具,组织能不能真重构、谁的工具最终胜出,都还没定。
政策部分本质是 OpenAI 的市场拓展(尤其公共部门 + 教育)。 “把 AI 素养当基础设施”“更新公共采购买 AI 工具”——方向有道理,但也直接利好 OpenAI 进政府和学校。读的时候分清”对社会的建议”和”对自己生意的铺路”。
对你的用处(红杉视角)
- 这是判断 “AI 从 coding 向通用知识工作扩张” 这条主线的一手厂商信号——和你最近看的 Salesforce Agentic、拾象 Era of Agent、Loop Engineering 是同一脉络。OpenAI 在用 Codex 占”知识工作通用工具”这个位,和 Anthropic 的 Claude 正面竞争。
- “离问题最近的人自己造工具、不等软件排期”这个判断,对看 垂直 SaaS / 内部工具 / 长尾软件 的投资影响最大:如果人人能自造一次性工具,很多”小而散”的 SaaS 需求会被吃掉——这点和你之前看的 a16z《软件在丢掉脑袋吗》、Service-as-a-Software 是一类问题。
- “并行任务 / 用户变编排者”和你正在琢磨的 Loop / 多 agent 编排 直接呼应。