121. 对 DeepMind 谭捷的访谈:机器人、跨本体、世界模型、Gemini Robotics 1.5 和 Google
张小珺Jùn|商业访谈录
2025/11/28
121. 对 DeepMind 谭捷的访谈:机器人、跨本体、世界模型、Gemini Robotics 1.5 和 Google
121. 对 DeepMind 谭捷的访谈:机器人、跨本体、世界模型、Gemini Robotics 1.5 和 Google

张小珺Jùn|商业访谈录
2025/11/28
在本期节目中,我们深入探讨了机器人技术的前沿发展,特别是从 Google DeepMind 的视角出发,审视基础模型与强化学习如何重塑机器人智能。嘉宾谭捷结合自身从图形学转向机器人研究的经历,分享了技术演进中的关键转折与现实挑战。
机器人领域正经历由大语言模型和强化学习驱动的范式转变,智能系统逐渐具备理解自然语言和执行复杂任务的能力。然而,核心瓶颈仍在于数据 —— 尤其是在非结构化环境中获取多样化、可扩展的真实交互数据极为困难。当前行业通过仿真、生成式模型和跨具身迁移等技术弥补数据缺口,Gemini Robotics 1.5 提出的 motion transfer 与快慢模型架构,展现了提升泛化与控制效率的新路径。尽管视觉主导当前感知系统,但灵巧操作将使触觉变得不可或缺。未来,通用型人形机器人被视为通向物理世界 AGI 的核心形态,而统一的端到端模型虽受算力限制,仍是长期目标。技术落地仍需多年,但 GPT 时刻的到来可能加速变革。
10:44
10:44
大语言模型让机器人理解人类语言并执行复杂任务
22:42
22:42
硅谷 AI 从业者进入 996 模式以保持竞争力
23:44
23:44
数据是制约机器人领域发展的主要瓶颈,当前数据量无法满足模型需求。
46:25
46:25
机器人可通过搜索谷歌地图定位垃圾处理点并依当地法规执行分类
52:43
52:43
生成物理正确的视频已成为新的仿真形式,可能取代传统物理仿真
1:06:37
1:06:37
世界模型是 VLV,输入视觉和语言可生成下一帧图像
1:11:11
1:11:11
灵巧手执行复杂任务时触觉必不可少
1:41:42
1:41:42
未来两三年将迎来机器人领域的 GPT 时刻