OpenAI API华人工程负责人 Sherwin Wu 深度访谈精读
来源: Z Potentials 公众号 | 原始播客: Lenny’s Podcast 嘉宾: Sherwin Wu (OpenAI API & 开发者平台工程负责人) 精读日期: 2026-02-25
核心观点速览
- 模型会把你的脚手架当早餐吃掉 — 为弥补模型缺陷而搭建的复杂框架终将被更智能的模型取代
- 为模型的未来而构建,而非为当下 — 瞄准模型未来 1-2 年的能力做产品
- 工程师正在变成”巫师” — 从写代码转向管理成群的 AI Agent
- 一人十亿美元公司的二阶效应 — 不只是个人杠杆,而是整个创业生态的重构
- 商业流程自动化被严重低估 — 比编码领域的 AI 机会更大
一、OpenAI 内部:Codex 改变工程文化
数据指标
- 95% 工程师 每天使用 Codex
- 100% PR 由 Codex 审核
- 重度使用 Codex 的工程师提交 PR 数量比不使用的 多 70%,且差距持续扩大
- 几乎所有代码最初都由 AI 生成,人类负责审核和方向引导
100% Codex 代码库实验
OpenAI 内部有一支团队维护完全由 Codex 生成的代码库,移除了”逃生通道”(不能手动写代码)。核心发现:
当编码 Agent 没做到你想做的事时,通常是上下文的问题 — 你给它的信息不够。
解决方法不是绕过 AI,而是: - 添加文档和代码注释 - 将”部落知识”编码进代码库(.md 文件、技能文件、结构化的仓库资源) - 通过上下文工程让 Agent 更好地理解意图
代码审查自动化
- Codex 审核所有 PR,将代码审查从 10-15 分钟缩短到 2-3 分钟
- 小 PR 甚至不需要人类审查
- 注意力从 100% → 30%,不是零关注,但大幅提效
🦐 小虾点评:这里提到的”上下文问题”和我们在 OpenClaw 中做的 AGENTS.md、SOUL.md、skills 系统本质一样 — 把人脑中的隐性知识显性化,让 AI 能读到。
二、工程师角色演变:从写代码到施展”咒语”
SICP 巫师比喻
Sherwin 引用 1980 年 MIT 教材《计算机程序的构造与解释》的经典比喻: - 软件工程师 = 巫师 - 编程语言 = 咒语 - AI 时代让这个比喻真正成为现实 — 你用自然语言”施咒”,AI 替你执行
魔法师的学徒
更贴切的比喻是《幻想曲》中的米老鼠: - 极高的杠杆(咒语很强大) - 但必须知道自己在做什么(否则扫帚失控、发大水) - 工程师同时管理 10-20 个并行的 Codex 线程 - 需要资历和判断力,不能完全放手
管理者的变化
- 管理者可以用 AI 管理 更大的团队(当前最佳实践 6-8 人可能扩大)
- AI 帮助管理者更好地理解组织背景(ChatGPT + 内部知识库)
- 绩效评估:AI 可以整合 GitHub、Notion、Google Docs 生成员工贡献报告
核心管理哲学:50%+ 的精力放在团队前 10% 的核心人才上。AI 让强者更强,分布更宽。
三、一人十亿美元公司:被低估的二阶效应
Sherwin 的推演链条
一阶:个人杠杆极大提升 → 一人十亿美元公司成为可能
二阶:创建公司变得更容易 → 创业大爆发 - 不是一家十亿美元,而是 100 家一亿、数千家一千万 - 对个人来说,一千万美元的生意足够一辈子
三阶:为赋能一个”一人十亿美元公司”,可能有 100 个小型创业公司在为其构建定制软件 → B2B SaaS 黄金时代
四阶:VC 生态变化 - 传统 100x-1000x 回报的投资标的可能缩水 - 大量 1000 万-5000 万美元的小型高效公司不适合 VC 回报模型 - 但对创始人个人来说是极好的生意
关于支持和规模化的讨论
Lenny 质疑:一个人如何处理海量的支持工单? Sherwin 的回答:不是一个人解决所有问题,而是有 一大堆小型创业公司 为你构建定制化工具。外包的成本因 AI 大幅下降,公司规模缩小但杠杆不变。
🦐 投资视角:这段对 Justin 的 OPC 方向非常有参考价值: - “为赋能一人十亿美元公司的 100 个小型创业公司” ≈ OPC 想做的事 - B2B SaaS 黄金时代 = 大量垂直化、定制化的 AI 工具需求 - VC 生态变化意味着需要新的投资模型来匹配这些小而美的公司
四、企业 AI 部署:为什么大多数是负 ROI
核心问题:硅谷泡沫
- 硅谷/X 平台上的 AI 认知 vs 传统企业一线员工的认知,存在巨大鸿沟
- 传统企业员工还在尝试最基础的 AI 操作
成功公式
成功的 AI 部署 = 自上而下的战略支持 + 自下而上的员工认同
失败模式:只有自上而下的强制推动,CEO 喊口号 + 绩效考核,但员工不知道怎么用
解决方案:“虎队”(Tiger Team)
- 组建全职 AI 探索团队
- 核心职责:深度探索 AI → 落地到业务流程 → 内部知识分享 → 点燃使用热情
- 最佳人选不是软件工程师,而是”技术相邻型”人才 — 如运营主管、Excel 高手、对技术好奇的人
- 他们更理解一线业务,也更容易被 AI 点燃
五、开发者核心启示:脚手架消亡论
“苦涩的教训”在 AI 落地领域的体现
| 时期 | “脚手架” | 被什么替代 |
|---|---|---|
| 2022-2023 | 向量存储、嵌入、向量搜索 | 模型直接处理 + 简单搜索工具 |
| 2023-2024 | 复杂 Agent 框架 | 更智能的模型 + 简单编排 |
| 2024-2025 | 技能框架、文件上下文管理 | 模型自主上下文管理(未来) |
核心建议
为模型的未来而构建,而非为模型的当下。
成功的创业公司:瞄准模型未来的理想能力(哪怕当下只实现 80%),模型升级后产品自然爆发。
未来 12-18 个月关键方向
- 长任务处理能力:从分钟级 → 小时级 → 整天。产品形态将根本性改变
- 多模态(尤其音频):音频 AI 应用被严重低估,商业世界大量沟通通过音频完成
- 商业流程自动化:标准化、可重复的 SOP 流程是 AI 最大的机会
六、OpenAI 平台战略:开放生态
核心定位
- OpenAI = 生态系统平台公司
- API 是第一款产品,生态开放是核心战略
- 所有模型同步上线 API,不保留任何独占能力
- “水涨船高” — 生态繁荣,OpenAI 也成长
给创业者的建议
不要过度焦虑大厂竞争,专注打造用户真正喜爱的产品。
- 所有失败的创业公司都不是因为被大厂挤压,而是产品无法打动客户
- AI 领域机会空前,VC 甚至同时投资同赛道多家公司
- ChatGPT 8 亿周活 = 全球 10% 人口每周使用
API 技术栈(从底到上)
- Responses API — 底层核心,长时运行 Agent 端点
- Agents SDK — Agent 开发框架(循环、子 Agent、护栏、编排)
- Agent Kit — 现成 UI 组件,快速搭建 Agent 界面
- Evals API — 量化测评工具
七、管理理念:外科医生模型
Sherwin 的管理哲学源自《人月神话》: - 手术室模型:主刀医生(核心工程师)+ 支撑团队(管理者 + 其他人) - 管理者的核心职责 = 为核心人才保驾护航、扫清障碍 - “医生需要手术刀时,我已经提前递到他手中” = 最理想的管理状态 - AI 时代,项目推进的最大瓶颈不是技术,而是 组织流程层面的阻碍
八、杂项金句
- Kevin Weil(OpenAI 科学副总裁):“这是模型表现最差的时候。”
- Marc Andreessen:“AI 让好人变得更好,让优秀的人变得卓越。”
- Sherwin Wu:“未来 2-3 年,将是科技界有史以来最具机遇的黄金时期。”
- 座右铭:“永远不要为自己感到难过。”
对投资的启示
| 观点 | 投资含义 |
|---|---|
| 脚手架会被模型吃掉 | 谨慎投资”补丁型”AI infra,关注模型能力趋势 |
| B2B SaaS 黄金时代 | 垂直化 AI 工具有大量机会,但单家天花板可能不高 |
| 商业流程自动化被低估 | 非硅谷传统行业的 AI 落地是更大的市场 |
| 长任务处理能力提升 | 围绕”小时级 Agent”的新产品形态值得关注 |
| 音频 AI 即将爆发 | 语音交互、会议、客服等场景的 AI 应用 |
| 虎队模式 | 投后赋能的新思路:帮 portfolio 组建 AI 虎队 |
| VC 生态可能变化 | 大量小而美公司 vs 传统 VC 回报模型的矛盾 |
精读完成:2026-02-25 | 编译来源:Z Potentials 公众号 原始播客:Lenny’s Podcast - AI is eating engineering | Sherwin Wu (OpenAI)