E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法
硅谷101
2025/12/11
E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法
E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法

硅谷101
2025/12/11
人形机器人正站在技术爆发的前夜,而灵巧手作为实现精细操作的核心部件,成为决定其能否真正走入现实场景的关键。本期节目深入探讨了这一领域的最新进展与深层挑战,从硬件设计到算法演进,揭示了行业正在经历的变革。
灵巧手的发展面临精细运动、泛化能力与可靠性的三重考验,当前演示如开可乐背后隐藏着感知、控制与硬件协同的复杂难题。主流驱动方案中,连杆、直驱与绳驱各有优劣,其中直驱因结构简单更受仿真研究青睐,而特斯拉采用的单向绳驱则聚焦量产可行性。陶一伟分享在 Optimus 项目中通过重构设计大幅提升装配效率的经验,体现工程落地的关键突破。算法层面,受 GPT 与 FSD 启发,端到端模型和大规模数据训练正成为新方向,但触觉反馈与数据采集仍受限。遥操作、仿真与视频构成数据金字塔,推动系统进化。尽管硬件已接近实用化,真正的 “GPT 时刻” 还需三到五年,依赖软硬件协同突破。
04:51
04:51
陶一伟曾在年会用机器人表演开可乐。
12:47
12:47
开可乐比收纳碗碟难得多,因需双手协调与精确控力
15:33
15:33
灵巧手的瓶颈在于多接触点交互带来的控制复杂性,而非单一硬件模块问题。
23:20
23:20
Sharpa 灵巧手能精准完成发扑克牌等复杂动作
29:26
29:26
直驱方案很惊艳,高自由度连杆驱动做的公司较少
31:54
31:54
直驱结构仿真难度不大,适用于高自由度灵巧操作
33:13
33:13
厂商通过筛选客户优化产品迭代而非直接盈利
38:17
38:17
带领团队重新设计灵巧手,实现量产突破
40:33
40:33
驱动器从手掌移至小臂以提升抓握效率
42:53
42:53
绳驱方案的整合是工程问题而非科学问题,最终能够克服。
46:42
46:42
机器人可通过观看人类视频学习复杂操作技能
48:25
48:25
近年越来越多人用 GPT 研究方式做端到端模型
57:49
57:49
绳驱技术路线更容易实现力控
58:19
58:19
遥操作数据质量高但量小,视频数据量大但利用尚不成熟
1:05:38
1:05:38
实验室间合作自下而上,学生合作易带动导师方向融合
1:07:09
1:07:09
若有确定算法框架,机器人短时间可完成多样任务,即达到 GPT 时刻