← All Articles

Physical AI that Moves the World — Applied Intuition (Latent Space)

Latent Space (Alessio + Swyx) × Qasar Younis & Peter Ludwig · Original

这篇在讲什么:Applied Intuition 两位创始人 Qasar Younis(CEO,前 YC COO)和 Peter Ludwig(CTO,前 Google Android 工程师)做了 10 年的公司,第一次出来上长 podcast。公司现在估值 150 亿美元,1000 人左右的团队(83% 是工程师,40 多个前创始人),30 多个产品线,覆盖汽车、卡车、矿山设备、农业机械、建筑机械、国防系统,今天日本路上跑的 L4(Level 4,无方向盘前提下的全自动驾驶)无人卡车就是他们做的。整场访谈想说的事其实很简单——把”physical AI”(物理 AI)和”screen AI”(屏幕里的 AI,也就是聊天框、代码补全那一类)切开看,落点是:现在卡住物理 AI 落地的不是模型不够聪明,是没法把模型塞进真实硬件里。

第一段:safety-critical 是性质差异,不是程度差异。 整场访谈的第一个破题动作就是 Qasar 把”屏幕里的 AI”和”机器里的 AI”切开。这点他反复强调——大语言模型推荐错一档 podcast 没人会死,但他们在日本路上跑的 L4 卡车今天就在路上,错一次就是事故。这种区分在国内可能听起来像废话,但放在 podcast 听众都是 LLM 工程师的语境下其实有意义:他想让你明白,他们没法用大模型公司那套”快速发布、快速迭代”的玩法,所有后面讲的取舍都从这点上长出来。

“We can’t have errors. Those are L4 trucks.” — Qasar, Physical AI vs. Screen AI

第二段:他们不是 Scale AI,做工具类产品是 10 年前不流行的赌注。 Peter 顺着讲起源。Applied 第一批客户是 robotaxi 公司,从仿真和数据基础设施切进去,10 年扩到 30 多个产品。Qasar 这里特意停下来澄清一件事:外界经常把他们和 Scale AI 归一类,但其实差很远——Scale 本质是服务公司、做数据标注,Applied 一直做工具。这点他讲得有点带情绪,因为 2016、2017 年那会儿做工具不被看好,他原话是当时的 VC 觉得这就是工作流,工作流没意思。Qasar 把自己定位成 NVIDIA 或 AMD 那种角色——技术供应商,但不做芯片。Peter 顺手补了一句,说他们的技术栈每两年完全重写一次,10 年里已经经历 4 轮——这点放在投资人的耳朵里大概会皱眉,但听起来像是工程师文化的真实状态。

“The VCs generally, their views was that toolings are just workflows, and workflows ultimately are not really interesting.” — Qasar, Origin Story

第三段:三大业务块,不做传感器但激光雷达在研发阶段不能省。 Peter 给出公司业务的三块划分:仿真和强化学习基础设施;真正的操作系统(包括调度器、内存管理、中间件、实时控制、失效保护、可靠的 OTA 升级);底层 AI 模型(自主驾驶模型、世界模型、人机多模态交互)。硬件这块他讲得很直接——Applied 不做传感器、不做芯片。但 LiDAR(激光雷达,每个像素返回距离信息的传感器)在研发阶段其实不能省,套路是:用 LiDAR 配相机一起训练,让相机自己学会”看到深度”,到量产车上再把 LiDAR 拆掉。Tesla 自己的研发车今天还挂着 LiDAR 在湾区跑,就是这个逻辑。国防场景反过来——晚上要看东西又不能主动发能量,于是偏好红外成像,激光雷达和雷达在战场上等于点亮自己。

“If you see, for example, a Tesla R&D vehicle, it actually has lidar on it to this day.” — Peter, Hardware, Sensors, and the LiDAR Question

第四段:操作系统这一段是全场最有力的论断——物理机器现在的状态,相当于安卓和 iOS 出现之前的手机市场。 这是访谈里最干净的类比。Peter 讲了一段他自己的 Android 起源故事:他在 Google 做过 Android,当年 Larry Page 想让 Google 的产品跑在所有手机上,于是 Google 买回来一堆手机准备适配,结果发现 50 部手机里有 50 个不同的操作系统,根本搞不动——Android 就是从这个痛点长出来的。Peter 说今天物理机器的状态就是这样:每个车厂、每个矿机厂、每个农机厂都有一套自己的固件,碎片化到没法部署 AI。

接下来他展开讲什么叫”操作系统”。大部分人脑子里的操作系统就是车里那块屏幕(HMI,人机界面),但那只是最上面薄薄一层。下面还有实时电机和转向控制、传感器数据流(他原话是想用 Microsoft Windows 跑这个延迟会死人)、宇宙射线翻 bit 之后的失效保护、可靠的 OTA 升级。OTA 升级这点他特意停下来强调——Tesla 现在一个月一次 OTA,其他车厂基本不更新,要更新得开回 4S 店。“把车 OTA 刷废了”和”把 iPad 刷废了”完全不是一个量级的事,前者是要赔车的。Applied 的操作系统跨多种芯片架构跑,不绑 CUDA 和 NVIDIA 那一套——因为安全关键场景的硬件本来就多元,这点他和大模型公司单一栈假设的对比讲得很清楚。授权完全开放,客户可以只买操作系统、只买开发工具、只买自主驾驶,组合自由。

“Physical machines today are more akin to the state of the phone market before Android and iOS existed.” — Peter, The Operating System Layer

“Bricking a car is a very expensive [problem].” — Peter, The Operating System Layer

第五段:AI 写代码已经穿透到嵌入式和操作系统这种最硬的领域,苦涩的教训半年内就翻转了 Qasar 自己的判断。 这一段很有意思。Peter 说内部 Cursor 流行了一阵,现在 Claude Code 在排行榜上领先。他们把 Sensor Studio(一个 GUI 形态的 CAD 类工具,用来设计自动驾驶车的传感器布局)改成开 API 让 agent 用文本配置,效果常常超过原来的图形界面。

讲到这里 Peter 直接搬出 bitter lesson(苦涩的教训,Rich Sutton 那篇,意思是靠通用方法加算力总是赢过靠人类先验)。他说半年前 Qasar 还公开写过文章——嵌入式系统、操作系统、数据库工程师不该被推去用 AI——现在所有领域都好用了。GPU shader(着色器,跑在显卡上的小程序)写作一年前还是垃圾,现在让人惊艳。但他立刻收住一句:安全关键的人工校验 100% 必须,不可能让模型自己签字放行。招聘上他们看到一种很明显的两极分布——投入精力学这些工具的工程师和没投入的工程师,生产力差距大到不像话。

“Six months ago I would’ve said the same thing, but it’s becoming super useful for every domain.” — Peter, AI Coding Adoption

第六段:校验和确认(V&V)的范式从黑白判断走向统计学,Cruise 那次事故 Peter 和 Qasar 之间有点拧巴。 Peter 解释 V&V(Verification & Validation,校验与确认)的范式切换。旧世界是 Euro NCAP(欧洲新车评估)那种通过 / 不通过的测试——遮挡的儿童突然横穿马路,自动紧急刹车(AEB)触发了没?答案非黑即白。新世界是模型时代,一切都是统计——多少个 9 的可靠性、平均故障间隔时间(MTBF)。他还顺便讲了一个反直觉的点:监管者本身不是 AI 实验室,他们要的是结果不是过程,所以经常是 Applied 反过来教育美国、欧洲、日本政府什么叫合理的 V&V。Qasar 接着补一句,说他们内部的标准远高于监管——监管是最低公约数,要做好产品必须远远超过。

讲到 Cruise 那次事故的时候他们俩之间有点小拧巴。Peter 直接说”那是技术失败”,Qasar 几乎是立刻打补丁——“真问题是公司怎么和监管沟通”,然后加了一句”Cruise 是有可能不死的”,意思是单看技术问题它本不至于死。Swyx 顺势把这件事和 Uber ATG 当年撞死无家可归者那件事串起来——单次事故是不是被过度放大?Qasar 收尾的时候说 Waymo 是把整个行业的标准抬高的正面榜样,而且统计上人类是远更糟的司机(他原话是开车去机场比飞行更危险)。但他承认人是情绪动物,单次事故会过度反应——AI 系统本身有冗余、有兜底机制,要真出灾难得很多东西同时失败。

“Regulation is almost a lowest common denominator. You really have to substantially exceed what the regulators are expecting to make good products.” — Peter, Statistical Validation

“There is a version where Cruise still exists.” — Qasar, Cruise Lesson

第七段:仿真不是替代真实,世界模型学的是因果,水滑那个例子是教科书级。 Peter 拆 sim-to-real(仿真到现实)的差距:没有任何仿真器能完美对齐现实,必须有一套校验流程不停修正参数。他讲了一个具体例子——人形机器人做杂技演示的时候,致动器(actuator,电机这种执行机构)会过热。如果把电机温度作为参数建进仿真,强化学习训出来的策略会自己学着调整动作避免过热;如果不建,部署到真机上机器人就过热挂掉。Alessio 当场反问了一句蛮聪明的——“那机器人在冰箱里跑你又不该担心过热啊”。Peter 承认这正是难点——找那条最优的成本收益边界(他用了 meniscus line 这个词,本意是凹液面线,借喻最优边界)。

Qasar 紧跟着给了一个很干净的测试金字塔:95% 是普通的持续集成 / 持续部署测试(CI/CD),4% 是台架测试(带电气电子但没轮胎的那种),1% 是真车。他原话是没有什么神奇国度可以让你不做真车测试。

世界模型最好的教学例子就在水滑(hydroplaning,轮胎在湿滑路面失去抓地力)这一段。Peter 讲:路面曲率、排水方向、前车减速这一组视觉线索,模型看到就学会”减速”,根本不需要先理解水滑这个物理概念。Swyx 当场总结了一句——它不需要知道有”水滑”这回事,就知道该开慢点。这句话比任何关于世界模型的长篇定义都更说明问题。

“It doesn’t need to know about hydroplaning to know that it needs to drive slower.” — Swyx 总结 Peter,World Models

第八段:核心 thesis——物理 AI 现在不被模型智能卡住,是被部署到硬件这一步卡住。 这一段是全场最关键的论断,Qasar 讲得很慢、很重。Peter 先铺背景——服务器端(offboard)的模型可以巨大、不在乎延迟;机上(onboard)的模型必须毫秒级响应、低功耗、小体积、抗振动抗温度。主要技术路线是蒸馏(distillation,把大模型压成小模型保留能力)。然后 Qasar 接过来给了那句论断:

“In physical AI world, we’re not really constrained right now by the intelligence of the models. It’s actually deploying them on the hardware they give you. Those constraints force creativity.” — Qasar, Onboard vs. Offboard

这句话他讲的时候带一点点自我打气的意味——好像在说”约束逼出创造力”是他们的优势。Peter 在旁边补了一些更具体的东西:很多场景比如矿山、农业根本没蜂窝信号覆盖,只能在机上跑;Gemma 2B 这种小模型可以跑在嵌入式设备上,但自主驾驶模型 100% 自研,只有车内语音助手这种通用功能他们才用通用模型。

为了让这句论断更有说服力,他们顺手把传统自主驾驶的历史钉了进来。RTK GPS(real-time kinematic,实时载波相位差分定位,1 到 2 厘米精度)做矿山和农业自动化已经 20 年了,靠的是写死路径让机器照走。这套东西能用,但只能”原路返回”,不是真正智能——智能必须有感知、有决策、能在动态世界里行动。Plan mode(先规划再执行的模式,Claude Code 里那种)也适用物理系统——挖一勺土,状态空间就改变了,必须重新规划。Peter 收尾说一切都可以归约到”下一个 token 预测”这个抽象上,包括矿山多步任务、国防多步任务,不只是开车。

第九段:量产化分三段,Peter 自夸他能列出任何一个机器人 demo 接下来会撞到的 20 个问题。 Qasar 在研究和量产之间塞了第三段叫”高级工程化”(advanced engineering)——他说 Applied 真正的主战场就在这一段,不是研究、也不是纯量产。这一段他们顺便聊到中国搞人形机器人跑 26 英里马拉松的事情。Peter 解释这是 prize policy(悬赏政策,除了立法和行政指令之外,政府推动产业的第三种工具)——经典案例是 DARPA Grand Challenge(美国国防部高级研究计划局的无人车大挑战赛,2004 到 2007 年那一系列),那个比赛真的把整个无人车行业拉起来了。Peter 觉得人形机器人跑完马拉松”any day now”就会发生。

然后是全场最有 punch 的一段——Peter 自夸:

“I can write down a list of I know exactly the next 20 problems they’re gonna hit. I can guess what they’re going to try to solve each of those, and I can guess which one’s gonna actually work.” — Peter, Productionization

10 年踩坑形成的经验——但他在 podcast 里没真的列那 20 个问题,留作开放。这是听完一遍觉得最想追问、但 Alessio 和 Swyx 没追的一段。

第十段:给创始人的建议——给商业问题加约束、相信复利技术、2014 年的建议放在 2026 年不能用。 Qasar 这一块讲得最密。第一条:技术问题本身已经是一组约束,但 VC 不会逼你给商业问题加约束(VC 普遍不太懂技术,听到”我们解决这个就赚大钱”就够了),所以创始人必须自己加约束。第二条:不要照抄成熟公司的战略——Steve Jobs 说”完全垂直整合”是 2007 年的 Apple 在说,1978、1982 年的 Apple 完全是另一回事(那时候 Apple 是把别人的电子件塞进外壳里)。第三条是访谈里最 dense 的一块:复利技术。他用 Waymo 举例——Waymo 长期看起来都很无聊,但 1260 亿美元的估值是复利兑现,他原话是”人脑情绪上理解不了复利效应”。要熬到能看到复利的那一天,所以前面要活下来。第四条他自爆——他自己能搞低调建公司是因为前 YC 首席运营官 + 前 Google 员工的资源积累(前 400 个员工大部分来自 Google),新创始人没这些底子,不能照抄”低调建公司”那一套。第五条:YC 2014 年的建议放在 2026 年根本不适用,当年像 Floodgate 这种百万美元以下规模的种子基金全美就个位数,3、4 年前已经 350 多家。Sam Altman 自己公开说后悔 YC 时给过一些建议——Qasar 觉得不是建议错了,是市场变了。

“This is truly compounding technology. The human brain just doesn’t emotionally understand the compounding effects.” — Qasar, Founder Advice

“Steve Jobs says be completely vertical. Well, yeah, in 2007, Apple is very different than 1978 and 1982.” — Qasar, Founder Advice

第十一段:招聘画像和 GMI 那段轶事。 公司在 Sunnyvale,招”工程师里的工程师”——懂底层、懂硬件软件交界的那一层、生产环境历练过。Peter 明确反 vibe coding(凭感觉让模型写代码、不深究底层的写法)独大派,他原话是”我们没那个奢侈”。但他也说大模型做教育现在效果好——他自己亲眼看到一个航空工程师靠 AI 工具快速变成 confident 的全栈工程师。Qasar 把”工程师心态”定义成极度好奇——光是什么?电波是什么?一直问到底层。这段他自爆自己是 GMI(General Motors Institute,通用汽车学院)出身,不是 HBS(哈佛商学院)。GMI 是 GM 100 年前为了解决密西根州工程师不够,干脆自己开了一所大学。Google 10 年前也讨论过办大学,没做。

收尾的时候他们扫了一遍物理机器的分类——道路上 vs 道路外,每一类下面还有子类。配送机器人(无人)和 robotaxi(有人)在工程上很不一样——前者不在意 jerk(加加速度,乘客感受指标),可以硬刹;后者必须考虑乘客感受。Peter 给了一个干净的判断启发——人类操作需要专门驾照的系统(车 / 卡车 / 飞机),技术上也分开看。

“If you get curious enough about software, you ultimately end up in hardware.” — Peter, Hiring Philosophy(Swyx 注:这是 Alan Kay 那句话的回响)


📌 金句摘抄

“We can’t have errors. Those are L4 trucks.” — Qasar, Physical AI vs. Screen AI

“The VCs generally, their views was that toolings are just workflows, and workflows ultimately are not really interesting.” — Qasar, Origin Story

“Our own technology stack has completely changed roughly every two years. We’ve probably done four complete evolutions of our own technology stack.” — Peter, Three Buckets

“Physical machines today are more akin to the state of the phone market before Android and iOS existed.” — Peter, Operating System Layer

“Bricking a car is a very expensive [problem]… honestly, like across the industry maybe one of the most just pure impactful things that we’ve done is we’re now enabling the industry to actually do software updates.” — Peter, Operating System Layer

“Six months ago I would’ve said the same thing, but it’s becoming super useful for every domain.” — Peter, AI Coding Adoption(自爆苦涩的教训在嵌入式和操作系统上翻转得多快)

“Regulation is almost a lowest common denominator. You really have to substantially exceed what the regulators are expecting to make good products.” — Peter, Statistical Validation

“There is a version where Cruise still exists.” — Qasar, Cruise Lesson

“It doesn’t need to know about hydroplaning to know that it needs to drive slower.” — Swyx 总结 Peter,World Models

“In physical AI world, we’re not really constrained right now by the intelligence of the models. It’s actually deploying them on the hardware they give you. Those constraints force creativity.” — Qasar, Onboard vs. Offboard(全场最关键的一句论断)

“I can write down a list of I know exactly the next 20 problems they’re gonna hit. I can guess what they’re going to try to solve each of those, and I can guess which one’s gonna actually work.” — Peter, Productionization

“This is truly compounding technology. The human brain just doesn’t emotionally understand the compounding effects.” — Qasar, Founder Advice

“Steve Jobs says be completely vertical. Well, yeah, in 2007, Apple is very different than 1978 and 1982.” — Qasar, Founder Advice

“If you get curious enough about software, you ultimately end up in hardware.” — Peter, Hiring Philosophy


Layer 2 — 我的标注

1. 核心论断反过来读,就是 Applied 自己最大的隐性风险,podcast 里没人逼问。 Qasar 那句”我们不被模型智能限制,是被硬件限制——约束逼出创造力”是全场最有力的论断,但反着读就是他们护城河的暴露面:如果未来 3 到 5 年机上芯片性能继续爆炸(NVIDIA Drive Thor、Tesla HW5、国内的车规芯片),把蒸馏这一类工程的难度大幅压下来,那”部署比训练难”这个壁垒会被吃掉一大块。Applied 的工程精度是真实的,10 年踩坑也不是假的,但工程精度从来不是那种能持续 10 年的护城河——它是会被新硬件代际抹平的。我读完这段是想追问的,但访谈停在了”约束逼出创造力”那种自我打气的语气上,Alessio 和 Swyx 都没接这一刀,Qasar 也没主动给对冲方案。这是听完最遗憾的一段。

2. 用 Waymo 类比”复利技术”在两个层面同时偷换概念,一句话盖过去了。 Qasar 拿 Waymo 1260 亿美元估值佐证”复利技术值得等”——但 Waymo 是 Alphabet 内部分拆出来的子公司,估值兑现的是 robotaxi 这一个终端产品的飞轮,是垂直自营的逻辑。Applied 是中立的平台公司,把技术授权给所有车厂,自己不持有终端产品。这两种公司的复利机制根本不是一回事——垂直自营的复利来自部署数据飞轮(开得越多数据越好模型越强),平台公司的复利来自客户基数和迁移成本(越多客户用越难换掉你)。后者在汽车行业里有个特别难的现实问题——一级供应商(Tier 1,给整车厂做整车系统模块的那层)历史上反复被整车厂软件自研重夺地盘,特别是这两年大家都在做”软件定义汽车”。Qasar 把”复利”这个词同时拿来盖技术深度和估值合理性,但这两层其实是分开的事,podcast 接受了这个类比没追。

3. Qasar 自己的 30 多个产品横跨 6 个行业,和他给创始人的”窄而深”建议直接打架。 整段创始人建议里最硬的一条是”给商业问题加约束”——但 Applied 自己跨汽车、卡车、矿山、农业、建筑、国防 6 个行业,30 多个产品。Qasar 的解释是”我们已经过了那个阶段”加上”我们的工作 compounds”。这个回答放在创始人建议这一段不太能立——Applied 自己的扩张性到底有没有踩到”宽而浅”的雷?没人追。一个平台横切 6 个监管结构、经济结构、工艺周期完全不同的行业,这本身是 Applied 的核心赌注,也是它 150 亿美元估值能不能兑现的真问题。整段创始人建议听起来更像是合理化他自己公司的扩张性,而不是真在给别人提建议。