Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号
来源: AI深度研究员(微信公众号)/ 36氪 | 日期: 2025-11-25 原文: Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号 精读日期: 2026-03-10
一句话总结
Jeff Dean 在斯坦福演讲中提出 AI 三大范式转变:从拼参数到稀疏激活(Pathways/MoE),从回答问题到自主行动(Agent),从追求极致到追求可用(TPU+蒸馏),Gemini 3 是这套系统思维的第一次完整展现。
核心内容
信号一:从拼大小到像大脑——Pathways/MoE 架构
传统模型每次推理激活全部参数,极度浪费。Jeff Dean 的类比:每次开灯不应该让家里所有电器都启动。
Pathways 架构的核心:构建超大模型但只激活 1%-5%。通过 MoE(专家混合)实现——模型内部有多个专家模块(图像/语言/代码等),输入进来后系统自动路由到对应专家。
关键数据:同样计算预算下,MoE 架构训练出的模型效果提升 8 倍。
转变本质:AI 竞争从”谁的模型更大”变成”谁能更聪明地调度资源”。
信号二:从回答到行动——Agent
这是与 Justin 开场语最直接相关的部分。Jeff Dean 用一个食谱网站 demo 说明:
用户只说了一句”做一个双语食谱网站”,Gemini 3 自动完成了:扫描识别照片文字 → 翻译 → 生成网站布局 → 配 AI 插图。
核心区分:助手是你问什么答什么;Agent 是你说目标、它自己拆解任务、调用工具、完成整个操作链。
“过去,你要告诉 AI 每一步怎么做。现在,你只需要说出目标,剩下的 AI 自己搞定。你的角色从使用者变成了指挥者。”
背后的技术突破是可验证领域的强化学习(代码能编译?通过测试?数学证明正确?),让模型具备了”探索→尝试→验证→改进”的闭环能力。
佐证:Gemini 在 2025 年 IMO 拿下金牌(5/6 题),而 2022 年 AI 连小学算术题正确率只有 15%。三年内从小学到奥赛金牌。
Agent 三要素:状态感知 + 工具组合 + 多步执行。
信号三:用得起才是真门槛——TPU + 蒸馏
Jeff Dean 讲了一个 2013 年的测算:如果 1 亿人每天用 3 分钟语音识别,Google 需要把服务器数量翻倍。一个功能的改进 = 整个公司服务器翻倍的代价。
TPU:专为 ML 设计的硬件。第一代(2015)比 CPU/GPU 快 15-30x,能效高 30-80x。最新第七代 Ironwood 比 TPUv2 性能提升 3600x,能效提升 30x。
蒸馏:大模型当老师教小模型。用 3% 数据通过蒸馏达到接近 100% 数据的效果(语音识别:58.9% vs 57%)。Gemini 因此能同时做到”云端强大”和”手机可用”。
竞争维度转变:从”多大参数/多少 token”到”能不能在设备上跑/成本多少/能否离线”。
金句摘录
- “在传统神经网络中,你为每个例子激活整个模型,这非常浪费。更好的方式是:拥有一个非常大的模型,但每次只激活其中 1% 到 5%。”
- “助手是你问什么它答什么,Agent 是你说目标、它自己拆解任务、调用工具、完成整个操作链。”
- “AI 不只是回答你,而是具有行动能力。”
- “过去,你要告诉 AI 每一步怎么做。现在,你只需要说出目标,剩下的 AI 自己搞定。你的角色从使用者变成了指挥者。”
- “光有好模型不够,必须让它用得起。”
Justin 视角
1. “需求和目标 > 拆任务”——对投资和工作方式的直接印证
Justin 开场说的”讲清楚需求和目标比自己去拆清楚任务重要得多”,正是 Jeff Dean 信号二的核心命题。这不是一个技术观点,而是一个人机协作范式的根本转变:
- 对创业者:产品设计从”教用户怎么用工具”变成”让用户说清楚想要什么”。UX 的核心竞争力从交互设计变成意图理解。
- 对投资人:评估 AI 产品时,核心问题从”这个模型多强”变成”这个产品能多好地理解用户意图、自主完成目标”。
- 对 Justin 自己:和 Claude Code/OpenClaw 的日常协作已经在实践这个模式——说目标,不拆步骤。
2. 信号一(MoE)的投资含义
稀疏激活 = 推理成本大幅下降 = AI 应用层的 unit economics 改善。这意味着:
- 以前因为推理成本太高而不成立的商业模式,现在可能成立了
- “AI-native”产品不再需要为每次 API 调用付高昂成本
- 关注:围绕推理效率优化的基础设施公司(路由/调度/缓存层)
3. 信号三(可用性)的中国视角
TPU + 蒸馏的叙事对中国市场尤其相关——端侧 AI、低成本部署正是国内 AI 落地的主战场。DeepSeek 走的也是类似路线(MoE + 蒸馏)。
4. 值得追踪
- Google 的 Agent 生态(与日历/邮件/云服务的深度集成)vs OpenAI 的 Operator/Computer Use vs Anthropic 的 MCP
- 蒸馏技术的演进——这是让 AI 从”demo 惊艳”到”真实可用”的关键桥梁
- Pathways 架构的开源/生态化进展