← All Articles

Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

AI深度研究员(微信公众号)/ 36氪 · 2026-03-10 · Original

来源: AI深度研究员(微信公众号)/ 36氪 | 日期: 2025-11-25 原文: Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号 精读日期: 2026-03-10

一句话总结

Jeff Dean 在斯坦福演讲中提出 AI 三大范式转变:从拼参数到稀疏激活(Pathways/MoE),从回答问题到自主行动(Agent),从追求极致到追求可用(TPU+蒸馏),Gemini 3 是这套系统思维的第一次完整展现。

核心内容

信号一:从拼大小到像大脑——Pathways/MoE 架构

传统模型每次推理激活全部参数,极度浪费。Jeff Dean 的类比:每次开灯不应该让家里所有电器都启动。

Pathways 架构的核心:构建超大模型但只激活 1%-5%。通过 MoE(专家混合)实现——模型内部有多个专家模块(图像/语言/代码等),输入进来后系统自动路由到对应专家。

关键数据:同样计算预算下,MoE 架构训练出的模型效果提升 8 倍。

转变本质:AI 竞争从”谁的模型更大”变成”谁能更聪明地调度资源”。

信号二:从回答到行动——Agent

这是与 Justin 开场语最直接相关的部分。Jeff Dean 用一个食谱网站 demo 说明:

用户只说了一句”做一个双语食谱网站”,Gemini 3 自动完成了:扫描识别照片文字 → 翻译 → 生成网站布局 → 配 AI 插图。

核心区分:助手是你问什么答什么;Agent 是你说目标、它自己拆解任务、调用工具、完成整个操作链。

“过去,你要告诉 AI 每一步怎么做。现在,你只需要说出目标,剩下的 AI 自己搞定。你的角色从使用者变成了指挥者。”

背后的技术突破是可验证领域的强化学习(代码能编译?通过测试?数学证明正确?),让模型具备了”探索→尝试→验证→改进”的闭环能力。

佐证:Gemini 在 2025 年 IMO 拿下金牌(5/6 题),而 2022 年 AI 连小学算术题正确率只有 15%。三年内从小学到奥赛金牌。

Agent 三要素:状态感知 + 工具组合 + 多步执行。

信号三:用得起才是真门槛——TPU + 蒸馏

Jeff Dean 讲了一个 2013 年的测算:如果 1 亿人每天用 3 分钟语音识别,Google 需要把服务器数量翻倍。一个功能的改进 = 整个公司服务器翻倍的代价。

TPU:专为 ML 设计的硬件。第一代(2015)比 CPU/GPU 快 15-30x,能效高 30-80x。最新第七代 Ironwood 比 TPUv2 性能提升 3600x,能效提升 30x。

蒸馏:大模型当老师教小模型。用 3% 数据通过蒸馏达到接近 100% 数据的效果(语音识别:58.9% vs 57%)。Gemini 因此能同时做到”云端强大”和”手机可用”。

竞争维度转变:从”多大参数/多少 token”到”能不能在设备上跑/成本多少/能否离线”。

金句摘录

Justin 视角

1. “需求和目标 > 拆任务”——对投资和工作方式的直接印证

Justin 开场说的”讲清楚需求和目标比自己去拆清楚任务重要得多”,正是 Jeff Dean 信号二的核心命题。这不是一个技术观点,而是一个人机协作范式的根本转变:

2. 信号一(MoE)的投资含义

稀疏激活 = 推理成本大幅下降 = AI 应用层的 unit economics 改善。这意味着:

3. 信号三(可用性)的中国视角

TPU + 蒸馏的叙事对中国市场尤其相关——端侧 AI、低成本部署正是国内 AI 落地的主战场。DeepSeek 走的也是类似路线(MoE + 蒸馏)。

4. 值得追踪

延伸阅读