← All Articles

Humanoid Robot Actuators — Firgelli 工程指南 + HN 讨论精读

Robbie Dickson, Firgelli Automations · Original

Firgelli Automations(线性执行器制造商)的”完整工程指南”——从物理学层面解释为什么人形机器人这么难做、为什么 Tesla / Figure / Apptronik 等大玩家不约而同收敛到同一个执行器架构。HN 讨论 124 分 52 评论,技术老兵给了非常硬的历史背景,但同时大量评论质疑:这文章本身是 AI 写的,配图也是 AI slop

文章在讲什么 — 一句话总结

人形机器人之所以难,不是算法难,是物理难——具体说是”5000 次冲击 / 小时 + 每次 2-3 倍体重 + 每次毫秒级反应”这套要求把绝大多数工业级执行器淘汰了。Tesla / Figure / Apptronik 等头部玩家最终都收敛到同一套架构:旋转关节用 Strain Wave Gear(应变波齿轮)+ 线性关节用 Planetary Roller Screw(行星滚柱丝杠)。

I. 走路的物理冲击 — 为什么是 5000 步

核心数字

关键概念:Back-drivability(反向驱动性)

如果执行器机械上”自锁”(像工业丝杠),冲击能量 100% 全砸进齿轮箱 → 立刻齿轮剪切失效。所以执行器必须能机械上”让一让”——这是为什么传统工业件直接出局。

Cost of Transport(CoT)— 决定一切的能耗指标

CoT = 能量 / (重量 × 距离)

类型 CoT
轮式车辆 0.01-0.05
双足机器人 0.2-0.5

双足比轮式效率差 10-50 倍。这意味着每多 1 克执行器重量,机器人都要每步搬一次。4000N at 800g 的执行器能改变行业;10000N at 5kg 的执行器在腿上几乎没用

II. Mass Penalty Spiral(质量惩罚螺旋)

最不留情的设计约束。一个具体例子:

总账:组件级 200g 错误 → 系统级 1.3kg 惩罚。指数级,不是线性。

旋转执行器的”反射惯性陷阱”

公式:J_output = J_rotor × (Gear Ratio)²——注意是平方

100:1 的减速比不只把扭矩放大 100 倍,也把电机转子的惯性在输出端放大 10000 倍。机器人脚踩地,地面想反向带动电机,但电机看起来”沉 10000 倍”——结果腿像砖头一样硬,冲击全砸进齿牙 → 剪切失效。

这就是为什么现代人形机器人的”减速比 sweet spot” 是 30:1-50:1,不是工业的 100:1+

线性执行器的”质量分布陷阱”

Proximal Actuation(近端驱动)原则:重的部件尽量靠近身体中心。前臂里放重执行器是灾难(杠杆放大),躯干里放就还能管。这就是为什么手指驱动通常在前臂用微型线性执行器 + 肌腱传动到手指。

III. 收敛架构 — 旋转 + 线性分工

不是所有人都走同一条路,但占主流的”工业级人形”都是这样:

关节 主要运动 执行器类型 用谁
肩关节旋转、腕、髋旋转 自旋 Strain Wave 旋转 共用
膝、踝、肘 伸 / 屈,承受冲击 Planetary Roller Screw 线性 Tesla Optimus / Figure / Apptronik

例外: - Unitree H1 / G1:膝、髋都用高扭矩旋转电机——优先速度和动态跳跃,不是静态举重 - Agility Digit:用 Series Elastic Actuators(弹簧 + 拉索)——独特路径 - Boston Dynamics 电动 Atlas:又是另一种变体

Strain Wave Gear(应变波齿轮)原理

3 个零件: 1. Wave Generator(输入):椭圆形塞子,连接电机 2. Flexspline(输出):薄弹性金属杯,外缘有齿(比外圈少 2 个齿) 3. Circular Spline(固定):刚性外圈,内有齿

椭圆塞子转动让薄金属杯变形,杯子和外圈在椭圆两端啮合,但因为齿数不同,每转一圈杯子向反方向”爬”一格——单级实现 50:1-100:1 减速

特性 Strain Wave 标准行星齿轮
反向间隙
扭矩/重量比 极高
效率 ~80-85% ~90-95%
抗冲击 较低(金属疲劳) 较高
形态 扁平”曲奇饼”状(单级) 圆柱状(多级)

Planetary Roller Screw vs Ball Screw

工业领域常用 Ball Screw,但人形机器人不能用。区别:

Brinelling 问题(球凹陷压痕):Ball Screw 在冲击下,球可能在轨道上压出永久微凹陷。一次不算什么,但 5000 次/小时 × 几周后,轨道就被搞糙了,效率掉、间隙变大、最终失效。Roller Screw 因为线接触,峰值应力低于屈服阈值,能扛多年。

额定 1000 万次循环的 ball screw,在走路冲击下可能 10 万次就废——评级假设的是平稳单向力,这种条件在人形机器人腿上从不存在”

IV. Gear Reduction 取舍 — N² 陷阱

电机想转 3000+ RPM 低扭矩;人膝爬楼梯只 30 RPM 高扭矩。100 倍差距靠减速箱补。

但减速箱代价是反射惯性 N²。

两条路径

1. Quasi-Direct Drive(QDD,“猎豹路径”): - 用谁:Unitree H1/G1、MIT Mini Cheetah、动态跳跃机器人 - 策略:大平饼电机 + 低减速比(6:1-10:1) - 优点:自然弹性——徒手能搬动腿,电机几乎无阻力。落地接触可以靠监测电流就检测,不用昂贵的力传感器 - 代价:电机得很大很重;静态保持姿势要烧大电流(持续发热)

2. 高减速比(“举重者路径”): - 用谁:Tesla Optimus、Figure、Apptronik Apollo、工业人形 - 策略:小快电机 + 高减速比(50:1-160:1,Strain Wave 或 Roller Screw) - 优点:紧凑轻便里出大力,能举重物、爬楼梯带载、静态保持不烧电 - 代价:执行器机械”不透明”——电机感觉不到环境的力。要靠专门的扭矩传感器(应变片)+ 复杂软件模拟弹性感

Sweet Spot:30:1-50:1

太低(<10:1):敏捷但弱。站着不动也过热。 太高(>100:1):强壮但危险。感觉不到冲击,齿牙在冲击下被啃光。 Sweet Spot 30:1-50:1:能举有用载荷 + 还能保持一定柔顺性 + 抗冲击。

Backdrivability 安全测试

简单测试:能不能徒手扳动机器人的手?

这个区别极其关键:可反向驱动的机器人摔倒会塌掉吸收冲击;不可反向驱动的机器人摔倒像石像一样砸下来——撞到地面或附近的人。

V-XII. 后续章节摘要

HN 讨论 — 老兵眼中的历史 + AI slop 质疑

顶帖:Animats(1990s 腿足运动研究者,第一手历史)

这条评论是 HN 全帖最值钱的内容。Animats 是上世纪 90 年代做腿足运动控制理论的工程师(拿过相关专利),亲历了过去 30 年所有失败尝试:

最后大家全回到电动机——3 相 AC 而不是 DC。关键 unlock无人机产业把 3 相电机和控制器做小、便宜、强大

学院派机器人组很小。MIT 和 Stanford 都不到一打人。这事儿要进展需要几亿美元的定制工程和 R&D。先于机器学习的钱投进去也搞不出有用产品

过去 5 年的进展令人惊叹。烧了很多钱。

这条评论提供了 Firgelli 文章完全没碰的视角:这不是单纯工程突破,是 30 年累计 + ML 出现 + 无人机产业溢出 + 大量资金共同促成

Boston Dynamics 路径解释

Animats 接续:BD 长期用液压(能用但低效)。承受执行器、罐子、蓄能器、泵、阀、动力源——这就是为什么 BD 机器又大又笨有人在 Google 说”我们得讨论一下液压”——2019 年的电动狗就是 BD 第一个全电动机器。

后续评论(Joel_Mckay):BD 当时是商业压力下做”烤好的忍者后空翻”——外人看着震撼,但本质是性能展示,不是工程方向Google 用观点搞垮了那家公司(注:BD 的原业主 Google 后来卖给软银又卖给现代)。

“AI slop” 质疑(重要!)

多个 HN 用户(RaSoJo、aardvarkdriver、olig15、moffkalast 等)指出:

  1. 作者 Robbie Dickson 在文章里用的是 AI 头像 —— “怎么能信一个用 AI 头像隐藏自己的人?” Robbie 真人在 huffpost 上有过文章
  2. 配图全是 AI 生成的,且很多技术上是错的
    • Strain Wave Gear 中间组件——内壁应该是光滑的,AI 画了齿
    • Inverted Planetary Roller Screw——5 个滚柱里 4 个垂直于螺纹(这种排布啥事不干)
    • Ball-screw 图——球塞不进螺纹,“挤”成扁的才能塞进去
    • “Stiffness control” 图——经典的”3 个互锁齿轮”(实际上转不起来)
    • “Optical encoder”图——弹性体被钥匙划开了
  3. 视频也是 AI 生成的

“Even the video is generated. The whole thing is just slop upon slop, I’m amazed that it got to the top of the front page here. I suppose it’s a genuinely impressive amount of fakery all integrated together.” —— moffkalast

反驳方(blueblisters):从高层系统视角看,文章内容大致正确,只是细节简化。

“为什么非要人形” 哲学讨论

elil17 提出:“我完全不理解为什么人偏要全人形机器人,而不是人形上半身 + 其他移动方式(轮式底盘)

制动器问题

vova_hn2 问:膝关节静止站立要持续抗重力(“零 RPM”),为什么不直接加机械锁?

开源对位

num42 推荐了:OpenTorque Actuator(github.com/G-Levine/OpenTorque-Actuator)——开源机器人执行器项目。

拧巴的地方 / 我的怀疑

  1. 文章是 PR 营销不是中立工程指南:Firgelli 是做线性执行器的,文章结尾”Roller Screw is yes” 表里他们家自然是 yes 那一栏。所有赞美 Roller Screw 的话都要打折看——他们卖这玩意。同时贬低 Ball Screw 也要打折。
  2. AI 配图的可信度问题严重:HN 的 olig15 抓了 6 张 AI 图都是机械上不成立的。如果连配图都不对,文字里的具体数字(10-15× 接触面积、80-85% 效率、5040 步)也得交叉验证
  3. 5000 步/小时 baseline 是商业可行性还是真实数据? 文章自己说是”baseline for commercial viability”——意思是想要商用就得扛这个频率。但这是设计目标还是已经被验证的数据?没引任何 Tesla/Figure/Apptronik 的实测数据
  4. CoT 0.2-0.5 这个范围跨度 2.5 倍——太宽。具体 Tesla Optimus / Figure 02 / Apptronik Apollo 的 CoT 实测分别是多少?文章没给
  5. “为什么非要人形”这个根本问题文章完全跳过——HN elil17 的质疑成立:“为什么不是人形上半身 + 轮式底盘”。Firgelli 显然不愿讨论这条,因为那条路径用的执行器组合可能完全不一样
  6. “反射惯性 N² 陷阱”是真的,但”30:1-50:1 sweet spot”这个数据来自哪里? 没引论文。Tesla Optimus 实测减速比是多少?文章笼统说”50:1 to 160:1”——160:1 离 sweet spot 远了。这种含糊处理可能是为了不踩任何头部公司
  7. HN 的 Animats 历史视角揭示了更深的真相问题不是工程难度,是经济学和资金量——3 大支柱(ML 出现 + 无人机产业溢出 + 几亿美元 R&D 资金)一起到位才催化了过去 5 年的进展。Firgelli 文章把这变成纯工程问题,是个 frame 错误

跟 Justin 已有笔记的连接

强连接(直接续上)

  1. ~/CC/Learning/Daily Digest/2026-04-24-YouTube-Karpathy-Skill-Issue-精读.md ——你 4 月 24 日精读 Karpathy 的”Skill Issue”演讲,第 12 节就是 “机器人:sensor / actuator 是中间机会”: > 自动驾驶是”第一个机器人应用”,10 年前一堆创业公司绝大多数没活下来。Robotics 因为难度高…

    Firgelli 这篇文章正好提供了 actuator 这个”中间机会”的工程深度的证据——为什么这层确实是 bottleneckKarpathy 说的”中间机会”在这里有了具体形态:planetary roller screw、strain wave gear、QDD 设计、torque sensor

  2. ~/Library/CloudStorage/Dropbox/CC-files/Deals/Prana Labs/世界模型-研究-2026-04-25.md ——你 4 月 25 日做的世界模型赛道研究,“五、具身机器人世界模型 — 玩家地图”覆盖了:

    • Figure AI 2025-09 Series C $1B @ $39B
    • 1X (OpenAI 系) 在募
    • 银河通用 Galbot
    • 智元 Agibot
    • Unitree(出货 5500+ 台 2025)

    这篇 Firgelli 文章给了一个反向角度:所有这些大玩家都被同样的物理约束筛过——Tesla / Figure / Apptronik 收敛到 rotary + linear 分工,Unitree 走 QDD 路径。估值再高,物理约束没变——这层”商品执行器”如果有公司能跑出来,是真生意

  3. 拾象月更时代笔记里的 4-Endgame 期权定价框架:人形机器人这条路也可以套用——

    • Strategic Acquisition:执行器供应商被大平台收购(类似 Frame.io→Adobe)
    • DaaS / 卖部件:Firgelli 这种独立部件卖家
    • Vertical SaaS:垂直应用方面(仓储 / 工业 / 家用)
    • Acqui-hire:技术团队被收

弱连接

  1. 你的 mental-models.md “Harness 双轴” entry——可以补一条”硬件 vs 软件 harness 的反向类比”。软件 harness 模型变强应该删步骤;硬件 harness(actuator)反过来——物理约束不会因为模型变强而消失。这是一个反向 entry 候选

投资视角的 takeaway

  1. Firgelli 这家公司本身:一家做线性执行器和电机的工业供应商。这篇文章是 PR + thought leadership 工具。值得了解但本身不是投资标的
  2. 真正值得跟的是行星滚柱丝杠(Planetary Roller Screw)这层供应链:人形机器人量起来后,谁能批量供货 Roller Screw 是关键。当前主要玩家是 Rollvis / SKF Ewellix 等欧洲精密制造老牌,中国玩家正在追
  3. Strain Wave Gear(Harmonic Drive)是日本公司 Harmonic Drive Systems 的传统垄断,绿的谐波 / 大族传动等中国公司在做替代——这个赛道值得关注
  4. OpenTorque-Actuator(开源)这种项目可能改变行业生态——类似 RISC-V 之于 CPU。值得跟踪
  5. “为什么非要人形”是真问题:elil17 的”人形上半身 + 轮式底盘”路径在工业 / 仓储场景大概率才是实际部署形态。评估具身机器人 portfolio 时要把这条作为对照路径

一句话总结

人形机器人难做不在算法在物理——5000 步/小时 × 2-3 倍体重冲击 × 毫秒级反应这套要求把绝大多数工业件淘汰,Tesla/Figure/Apptronik 收敛到 rotary(Strain Wave)+ linear(Roller Screw)分工是这套物理约束的必然出口,30 年来电机 / 液压 / SMA / 气动几乎所有路径都试过失败过,只有过去 5 年因为 ML + 无人机产业溢出 + 大资金到位才催化突破——但 HN 评论说这文章本身是 AI slop(配图错误 / AI 头像作者 / 视频生成),可信度要打折