精读 OpenAI《知识工作的下一个时代》——Codex 如何从写代码扩张到知识工作

OpenAI

受众：Justin（红杉中国 MD）原文：OpenAI 官方报告，2026-06-02，11 页 PDF，全文英文一句话定性：这是 OpenAI 的官方报告 + 软性宣传——主张 Codex 正在从”写代码工具”扩张成”知识工作的通用工具”，并借此向政策制定者喊话。数据全部来自 OpenAI 自己。内容值得看（趋势判断和框架不错），但要按”厂商自述、利益相关方”打折。

下面按原文结构逐段讲清楚。

开篇数字（封面后第一页）

三个核心数字： - 500 万 Codex 周活用户 - >6 倍：自 2 月桌面 App 上线以来周活的增长 - >3 倍：知识工作者（非开发者）采用 Codex 的速度是开发者的 3 倍多

并点明知识工作者增长最快的三类任务：数据分析、研究、知识产出物（knowledge artifacts，指报告/备忘/合同这类文档成果）。

一、现代世界里的知识工作

知识工作已经主导发达经济体。 美国超过 40% 的劳动力（约 7200 万人）主要跟信息打交道——分析、代码、文档、设计、系统、决策、沟通。这是个晚近才发生的历史变化： - 1850 年：约 60% 的美国人务农 - 1970 年：务农降到约 4%，产出反而暴涨 - 制造业一度吸收了被替换的劳动力，1960 年占美国就业约 26% 的峰值，之后随全球化和机器人回落 - 知识工作填补了这块空间。“知识工作者”这个词是 Peter Drucker 1959 年造的，指主要输入输出是”符号”而非农作物/制成品的职业。现在涵盖软件、工程、科学、管理、教育、医疗、法律、金融、设计、营销、新闻、咨询和大部分公共行政。

一个反常的”丰裕”（strange abundance）：现代人产出文档、消息、仪表盘、模型、演示的速度前所未有地快，但花在”找上下文、核对互相矛盾的版本、等回复、在系统间搬信息”上的时间也大得惊人。引麦肯锡全球研究院的研究：普通知识工作者每周约 28% 的工作时间在处理邮件，近 20% 在找内部信息或找能帮忙的同事。

根因是”零敲碎打的数字化”（piecemeal digitization）：邮件让通信即时化，文档变协作，表格/仪表盘/工单系统/CRM/知识库/聊天工具/各种 SaaS 各自解决了一个局部问题，却留下一堆割裂的工具。我们需要的信息藏在收件箱、文件夹、聊天、评论、权限、仪表盘、工单、会议、还有我们自己的记忆里。“办公室数字化了，却没有被整合（digital without becoming integrated）”——这句是全文最精炼的诊断。

定义日常知识工作成本的三种摩擦（这个三分法值得记）： 1. 搜索（search）：在庞杂、不透明的系统里找到对的输入——对的文件、条款、路径、数据集、消息、专家，全都是大海捞针。 2. 协调（coordination）：在团队、工具、格式之间搬动信息和决策，同时还要应付组织里互相分歧、不断变化的利益诉求。 3. 审批与验证（approval and verification）：让成果被接受、并经得起现实检验。工程里是测试/评审/部署/持续监控；法律或咨询里是合伙人评审、客户验收、可辩护的论证；科学里是实验、复现、证据。

二、生产率悖论：为什么电脑进了办公室却没提升产出

这一段是全文理论骨架，借了两个经典： - Robert Solow 的观察：“计算机时代到处都看得见，唯独不在生产率统计里。” - Erik Brynjolfsson 给它起名叫 生产率悖论（productivity paradox），并提出更深的理论：信息技术只有在组织重新设计流程、技能、管理结构和工作流之后，才会带来大的收益。

电力的类比（这个类比是理解全文主张的钥匙）：电力的大收益不是在工厂”用电动机替换蒸汽机”时出现的，而是在工厂停止把电当蒸汽的替代品、把厂房按”每台机器旁边一个分布式电动机”重新设计之后才出现——这花了几十年。

知识工作还在等它的”厂房重新设计”：过去几代办公软件降低了”生产中间产出物”的成本，却没降低”消化这些产出物所需的注意力”。邮件让通信变便宜，于是通信量翻倍；文档让起草变便宜，于是草稿和评审轮次翻倍。结果是产出物过剩、时间和注意力越来越稀缺。

三、“Codex 就是那次重新设计”

这是 OpenAI 的核心主张（也是软广点）：工厂把电动机放到每台机器旁边，Codex 把 AI 放到每个待解决的问题旁边。

大组织过去是围绕”生产和搬运产出物的高成本”建起来的——秘书池、跨职能团队、文员金字塔、长长的评审链。Codex 把更多”自主权（agency）“交到最需要的人手上，在产出物生产的前、中、后都化解瓶颈：找输入、协调工作流、产出交付物、检查质量、追审批。主张是公司能更快、更少延迟和行政负担地运转，人能聚焦在最有影响的任务上。

案例 1 — GroundVue（创始人 Travis Hoppe、Ann Lewis、Shannon Arvizu）：帮政府之间互相学习，把公开会议做成可大规模检索、可比较的内容。全美约 9 万个政府机构，关键信息散落在视频、网站、地方平台上。GroundVue 用 Codex 找到这些难触达的公开来源、持续采集整理。过去要几天几周的活现在几分钟，小团队干了过去要一大群技术员和研究员才能干的事——把碎片化的公共信息变成可用的机构知识。

四、越过软件边界：Codex 在知识工作里的扩张

Codex 现在 >500 万周活，自 2 月桌面 App 上线涨了 >6 倍。虽然起家是软件开发工具，但更快的增长来自更广的”知识工作”。 - 数据科学家用它清洗数据集、建模型、自动化分析 - 财务团队用它对账、做预测、生成报告 - 设计师用它做产品原型、出素材 - 营销用它分析活动、产内容、综合客户反馈

关键数据： - 知识工作者现在约占 Codex 用户 20%，采用速度是开发者的 3 倍多（涵盖产品/项目管理、设计、研究、学术） - 个人用户占 >5%，增速是开发者的 4 倍多（爱好/创作、教育/自学、个人理财、娱乐）

图：Codex 用户构成随时间变化——开发者占比从约 88% 一路降到约 74%；知识工作者升到约 20%；个人用户小幅上升。

最值得看的是知识工作者的任务结构（图：知识工作者每周任务渗透率）： - 知识产出物 72% - 工程运维（engineering operations）47% - 代码实现（code implementation）46% - 应用管理 42% - 研究 41% - 代码理解 35% - 数据分析 27% - 协作 23% - 代码校验 16% - 业务职能工作流 15%

软件工作和知识工作的边界正在模糊：开发者用 Codex 做知识产出物，知识工作者用它写代码、做工程运维。产品经理自己搭仪表盘，而不是叫另一个团队做；研究员自己写数据清洗脚本，不走工程排期；设计师不等开发就把原型发出去；高管自己搭一个对账+周报的内部工具。“Codex 让离问题最近的人能自己把缺的工具造出来，不用等正式的软件路线图批准和交付。”——这句是全文对组织影响最关键的判断。

行为上最重大的变化：并行任务。 现在约 50% 的用户在一天里某个时点会同时跑不止一个 Codex 任务（4 月中旬还不到三分之一）。从串行到并行，让一个知识工作者能以一个小团队的规模运作：一个任务查数据集、一个起草脚本、一个拼报告、一个检查应用。用户从”一次执行一个任务”变成”多条工作流的编排者（orchestrator）“。

案例 2 — Proaction（联合创始人 Colin Knudsen）：帮车队管理车辆和设备，数据散落在车联网系统、维保平台、表格和员工记忆里。用 Codex 把客户对话变成定制提案、工作流原型、可跑的演示——在签合同之前就能快速搭建并验证方案，而不是用通用销售话术。把客户发现、销售、产品开发串到一起，一个 5 人创业公司能打出远超体量的竞争力。

五、Codex 增长最快的地方

最快增长的三类任务（周环比）：数据分析 +110%、研究 +37%、知识产出物 +36%。细节： - 知识产出物里最常处理文本文档（Google Docs/Word/报告/备忘/合同）和多媒体（图片/音频/视频），其中处理 PDF 和表格的用户增长 >50% - 研究里常见网页+内部知识检索，市场研究（公司、行业、竞品、市场规模和定位）增长显著 - 数据分析里”数据标注（data labeling）“占大头、增速也最快 - 还有 >40% 增长的一堆任务：起草消息、做产品设计、理解合同/法规/政策、招聘和面试

案例 3 — 数学教授 Taiyo Inoue（加州州立大学）：用 Codex 自动化教学里最没成就感、最耗时的部分——在学习管理系统（Canvas）里维护课程信息。让 Codex 生成脚本去更新作业、日历、材料、公告，每周省 4-5 小时。省下的时间他把课重新设计成协作式解题，让学生更多地一起、面对面地做数学。

六、智能体时代的政策建议（OpenAI 向政策制定者喊话）

定调：给人们用上这些工具、并教会他们负责任地构建和委派的国家与组织，会获得最大的生产率收益。 Codex 不是知识工作者的替代品，而是让离问题最近的人拥有更多自主权和解决难题的能力。四条建议：

现代化工作流，并衡量真正有效的东西：公共机构应该用 agent 来减少行政积压、改善软件系统、检索和对账记录、支持科研、更快交付公共服务。成效要用老百姓看得懂的结果衡量——更短的等待、更少的表格、更快的审批、更好的福利发放、更低的行政成本。收益不该只归最大的公司，政策要支持学校、创业公司、小企业、非营利、研究者和政府的广泛可及。
把 AI 素养当成核心劳动力技能：政府应把 AI 素养当成基础经济设施，通过学校、社区大学、公共机构、图书馆资助动手培训；鼓励雇主用补贴、税收激励、采购、合作给员工带薪学习真实工作流的时间。
把工作者放在 AI 采用的中心：离工作最近的人最清楚 AI 在哪能让工作更好、更安全、更高效——护士知道哪些表格拖慢护理，社工知道福利发放在哪卡壳，机械师知道哪些交接出错，老师知道行政工作占了多少跟学生相处的时间。政府应通过小企业补助、公共部门创新基金、技术援助和正式渠道支持”工作者主导”的 AI 采用。回报最高的用途往往是本地的、具体的：诊所、实验室、地方政府办公室、小制造商或非营利的一个小工具。
围绕”要完成的工作”更新公共采购：政府应更新采购，让机构能买”解决运营问题的 AI 工具”，而不只是买软件许可证。公共部门试点要满足隐私、安全、可审计、人类监督；机构应被授权在安全沙箱里测试工具，并把”可衡量地减少积压、提升质量、降低行政负担”的东西规模化。

案例 4 — Luke Xing：用 Codex 做了个桌面 App，补偿他左耳严重且波动的听力损失。用大白话把问题描述给 Codex，做出一个跨频段测听力、为不同设备调整音频输出的工具，帮他在音乐、通话、日常听觉里恢复平衡。它不是医疗设备，是对一个非常具体、商业软件没覆盖的难题的个人解决方案。“人们不再需要等别人来造他们需要的工具——越来越多地，他们可以自己造。”

拧巴的地方 / 我的提醒

这是 OpenAI 自家报告，数据全是自报。 500 万周活、>6 倍增长、知识工作者 >3 倍采用速度、各任务渗透率和增速——全部来自 OpenAI 内部，没有第三方审计，定义（什么算”知识工作者”、什么算”一个任务”、“周活”口径）也没公开。方向可信（Codex 确实在向非开发者扩张），但具体数字别当硬数据引用。
“周环比增长”容易夸大。 数据分析 +110% WoW 这种数字，基数小的时候很容易冲得很高；单看周环比会高估稳态趋势。看绝对渗透率（数据分析才 27%）比看增速更靠谱。
四个案例都是精选的成功故事（幸存者）。 GroundVue、Proaction、Taiyo Inoue、Luke Xing 都是正面样本，没有任何”用了没效果/翻车”的对照。case 是用来佐证叙事的，不是中立证据。
电力类比很漂亮，但 OpenAI 把自己直接放进”那次厂房重新设计”的位置——这是论证里最大的一跳。 电力的收益花了几十年、靠的是组织重构而不只是工具；报告承认这点，却又暗示 Codex 已经是答案。更稳的读法是：Codex 是这次重构的一个候选工具，组织能不能真重构、谁的工具最终胜出，都还没定。
政策部分本质是 OpenAI 的市场拓展（尤其公共部门 + 教育）。 “把 AI 素养当基础设施”“更新公共采购买 AI 工具”——方向有道理，但也直接利好 OpenAI 进政府和学校。读的时候分清”对社会的建议”和”对自己生意的铺路”。

对你的用处（红杉视角）

这是判断 “AI 从 coding 向通用知识工作扩张” 这条主线的一手厂商信号——和你最近看的 Salesforce Agentic、拾象 Era of Agent、Loop Engineering 是同一脉络。OpenAI 在用 Codex 占”知识工作通用工具”这个位，和 Anthropic 的 Claude 正面竞争。
“离问题最近的人自己造工具、不等软件排期”这个判断，对看 垂直 SaaS / 内部工具 / 长尾软件 的投资影响最大：如果人人能自造一次性工具，很多”小而散”的 SaaS 需求会被吃掉——这点和你之前看的 a16z《软件在丢掉脑袋吗》、Service-as-a-Software 是一类问题。
“并行任务 / 用户变编排者”和你正在琢磨的 Loop / 多 agent 编排 直接呼应。