Gemini 3 之后，谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

AI深度研究员（微信公众号）/ 36氪 · 2025-11-25 · Original

来源: AI深度研究员（微信公众号）/ 36氪 | 日期: 2025-11-25 原文: Gemini 3 之后，谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号精读日期: 2026-03-10

一句话总结

Jeff Dean 在斯坦福演讲中提出 AI 三大范式转变：从拼参数到稀疏激活（Pathways/MoE），从回答问题到自主行动（Agent），从追求极致到追求可用（TPU+蒸馏），Gemini 3 是这套系统思维的第一次完整展现。

核心内容

信号一：从拼大小到像大脑——Pathways/MoE 架构

传统模型每次推理激活全部参数，极度浪费。Jeff Dean 的类比：每次开灯不应该让家里所有电器都启动。

Pathways 架构的核心：构建超大模型但只激活 1%-5%。通过 MoE（专家混合）实现——模型内部有多个专家模块（图像/语言/代码等），输入进来后系统自动路由到对应专家。

关键数据：同样计算预算下，MoE 架构训练出的模型效果提升 8 倍。

转变本质：AI 竞争从”谁的模型更大”变成”谁能更聪明地调度资源”。

信号二：从回答到行动——Agent

这是与 Justin 开场语最直接相关的部分。Jeff Dean 用一个食谱网站 demo 说明：

用户只说了一句”做一个双语食谱网站”，Gemini 3 自动完成了：扫描识别照片文字 → 翻译 → 生成网站布局 → 配 AI 插图。

核心区分：助手是你问什么答什么；Agent 是你说目标、它自己拆解任务、调用工具、完成整个操作链。

“过去，你要告诉 AI 每一步怎么做。现在，你只需要说出目标，剩下的 AI 自己搞定。你的角色从使用者变成了指挥者。”

背后的技术突破是可验证领域的强化学习（代码能编译？通过测试？数学证明正确？），让模型具备了”探索→尝试→验证→改进”的闭环能力。

佐证：Gemini 在 2025 年 IMO 拿下金牌（5/6 题），而 2022 年 AI 连小学算术题正确率只有 15%。三年内从小学到奥赛金牌。

Agent 三要素：状态感知 + 工具组合 + 多步执行。

信号三：用得起才是真门槛——TPU + 蒸馏

Jeff Dean 讲了一个 2013 年的测算：如果 1 亿人每天用 3 分钟语音识别，Google 需要把服务器数量翻倍。一个功能的改进 = 整个公司服务器翻倍的代价。

TPU：专为 ML 设计的硬件。第一代（2015）比 CPU/GPU 快 15-30x，能效高 30-80x。最新第七代 Ironwood 比 TPUv2 性能提升 3600x，能效提升 30x。

蒸馏：大模型当老师教小模型。用 3% 数据通过蒸馏达到接近 100% 数据的效果（语音识别：58.9% vs 57%）。Gemini 因此能同时做到”云端强大”和”手机可用”。

竞争维度转变：从”多大参数/多少 token”到”能不能在设备上跑/成本多少/能否离线”。

金句摘录

“在传统神经网络中，你为每个例子激活整个模型，这非常浪费。更好的方式是：拥有一个非常大的模型，但每次只激活其中 1% 到 5%。”
“助手是你问什么它答什么，Agent 是你说目标、它自己拆解任务、调用工具、完成整个操作链。”
“AI 不只是回答你，而是具有行动能力。”
“过去，你要告诉 AI 每一步怎么做。现在，你只需要说出目标，剩下的 AI 自己搞定。你的角色从使用者变成了指挥者。”
“光有好模型不够，必须让它用得起。”

Justin 视角

1. “需求和目标 > 拆任务”——对投资和工作方式的直接印证

Justin 开场说的”讲清楚需求和目标比自己去拆清楚任务重要得多”，正是 Jeff Dean 信号二的核心命题。这不是一个技术观点，而是一个人机协作范式的根本转变：

对创业者：产品设计从”教用户怎么用工具”变成”让用户说清楚想要什么”。UX 的核心竞争力从交互设计变成意图理解。
对投资人：评估 AI 产品时，核心问题从”这个模型多强”变成”这个产品能多好地理解用户意图、自主完成目标”。
对 Justin 自己：和 Claude Code/OpenClaw 的日常协作已经在实践这个模式——说目标，不拆步骤。

2. 信号一（MoE）的投资含义

稀疏激活 = 推理成本大幅下降 = AI 应用层的 unit economics 改善。这意味着：

以前因为推理成本太高而不成立的商业模式，现在可能成立了
“AI-native”产品不再需要为每次 API 调用付高昂成本
关注：围绕推理效率优化的基础设施公司（路由/调度/缓存层）

3. 信号三（可用性）的中国视角

TPU + 蒸馏的叙事对中国市场尤其相关——端侧 AI、低成本部署正是国内 AI 落地的主战场。DeepSeek 走的也是类似路线（MoE + 蒸馏）。

4. 值得追踪

Google 的 Agent 生态（与日历/邮件/云服务的深度集成）vs OpenAI 的 Operator/Computer Use vs Anthropic 的 MCP
蒸馏技术的演进——这是让 AI 从”demo 惊艳”到”真实可用”的关键桥梁
Pathways 架构的开源/生态化进展