scripod.com

109. 机器人遭遇数据荒?与谢晨聊:仿真与合成数据、Meta 天价收购和 Alexandr Wang

本期节目聚焦机器人领域的仿真技术与合成数据应用,主持人与光轮智能创始人谢晨深入探讨了这两项技术在 AI 训练中的关键作用,以及它们在解决真实数据不足方面的潜力与挑战。
谢晨分享了他在 Cruise、英伟达和蔚来从事自动驾驶仿真的经验,并介绍了合成数据如何帮助填补真实数据的缺口。他指出,合成数据在自动驾驶中已占训练数据的约 30%,而在长尾场景中比例更高。与自动驾驶相比,具身智能对物理交互要求更高,仿真难度更大。当前,合成数据面临泛化性和仿真精度的瓶颈,需要提升算法能力和仿真引擎质量。全球具身智能产业链正在形成,包括硬件公司、基座模型公司、软硬结合公司和以仿真为中心的公司。英伟达等大厂正加大仿真投入,而整个行业仍处于早期阶段,尚未找到明确的 scaling law 路径。
02:48
02:48
谢晨透露公司已接近盈利状态
04:04
04:04
合成数据从 2D 标注走向 3D 轨迹生成
12:48
12:48
合成数据能有效解决边角案例和系统级安全问题
14:11
14:11
一个真实问题可在仿真中扩展为成千上万个测试案例
31:45
31:45
当前亟需采集物理交互数据并建立评估榜单
42:48
42:48
可自动化生成核心物理参数并泛化至不同仿真资产
47:38
47:38
全站仿真依赖仿真、工程、算法与运营四大能力
53:00
53:00
Alexandr Wang 帮 Meta 挖走核心人才,开始产生实际价值
53:57
53:57
增强真实到仿真过程的信息多样性和准确性是缩小数据缺口的关键手段
57:43
57:43
π 公司虽轻视仿真,但已开始招聘相关负责人
1:14:48
1:14:48
老黄关注合成数据,行业正朝混合训练方向靠拢
1:17:39
1:17:39
IsaSIM 与 Mujoco 有望统一,形成新一代仿真标准
1:22:40
1:22:40
具身机器人与大模型未来可能趋近,如可在火星上操作
1:26:14
1:26:14
特斯拉从 GPT 获得启发,认识到扩展 transformer、数据和算力可取得成果
1:29:35
1:29:35
团队优势在于习惯被高强度锤炼,并具备规模化和质量管控经验
1:38:45
1:38:45
推荐《三国演义》和乔布斯相关书籍作为必读