scripod.com

109. 机器人遭遇数据荒?与谢晨聊:仿真与合成数据、Meta 天价收购和 Alexandr Wang

Shownote

今天又是一集机器人专场。嘉宾是光轮智能创始人兼 CEO 谢晨,他曾在英伟达、Cruise 及蔚来汽车担任自动驾驶仿真负责人。我们的话题非常具体,即: 仿真与合成数据。 今天的具身智能尚且没有找到 scaling law 的有效配方,其中,数据是一个关键卡点。我们 106 集的嘉宾银河通用创始人王鹤就提到,真实数据在他们的训练数据比重仅仅 1%,合成数据挑起大梁。 今天这集节目,我与谢晨聊了聊仿真与合成数据的实操细节。 02:00 开始的快问快答 02:48 高频词汇解析:Sim2Real(从仿真到现实)、Sim2Re...

Highlights

本期节目聚焦机器人领域的仿真技术与合成数据应用,主持人与光轮智能创始人谢晨深入探讨了这两项技术在 AI 训练中的关键作用,以及它们在解决真实数据不足方面的潜力与挑战。
02:48
谢晨透露公司已接近盈利状态
04:04
合成数据从 2D 标注走向 3D 轨迹生成
12:48
合成数据能有效解决边角案例和系统级安全问题
14:11
一个真实问题可在仿真中扩展为成千上万个测试案例
31:45
当前亟需采集物理交互数据并建立评估榜单
42:48
可自动化生成核心物理参数并泛化至不同仿真资产
47:38
全站仿真依赖仿真、工程、算法与运营四大能力
53:00
Alexandr Wang 帮 Meta 挖走核心人才,开始产生实际价值
53:57
增强真实到仿真过程的信息多样性和准确性是缩小数据缺口的关键手段
57:43
π 公司虽轻视仿真,但已开始招聘相关负责人
1:14:48
老黄关注合成数据,行业正朝混合训练方向靠拢
1:17:39
IsaSIM 与 Mujoco 有望统一,形成新一代仿真标准
1:22:40
具身机器人与大模型未来可能趋近,如可在火星上操作
1:26:14
特斯拉从 GPT 获得启发,认识到扩展 transformer、数据和算力可取得成果
1:29:35
团队优势在于习惯被高强度锤炼,并具备规模化和质量管控经验
1:38:45
推荐《三国演义》和乔布斯相关书籍作为必读

Chapters

机器人专场:仿真与合成数据探讨
00:00
开始的快问快答
02:00
高频词汇解析:Sim2Real(从仿真到现实)、Sim2Real 的 gap、合成数据
02:48
从 Cruise 到英伟达到蔚来,怎么做合成数据和仿真?
04:31
制作合成数据的具体流程?合成数据与真实数据的配比?
14:11
在合成数据上,智能驾驶和具身智能的区别(智能驾驶是视觉的游戏,具身智能的物理交互最关键)
16:17
物理的 Real2Sim(真实到仿真)工作流是怎样的?怎么评估成功的仿真?关键技术节点?
32:41
Physical Intelligence(π)对仿真与合成数据的两难态度
46:18
辣评 Meta 300 亿美金收购 Scale AI 和极其 aggressive 的 Alexandr Wang
48:55
合成数据目前面临的瓶颈
53:57
全球具身智能产业链 Mapping:
55:25
美国存在具身模型层的创业机会,中国在我看来字节、小米、理想更适合做 “大脑”
1:09:22
老黄在内部说:NV is a simulation company
1:15:33
终局的模型应该是是跨宇宙、跨世界、跨本体(提升跨宇宙的能力,本质是提升泛化性)
1:21:25
具身智能的产业还在 GPT-1 阶段,还没找到 scaling law 的配方
1:23:28
我创业刚开始,从具身的本科开始学起
1:28:21
最后的快问快答
1:37:37

Transcript

谢晨: 小扎给 Alexandr Wang 的这个定位叫 Chief AI Officer,我觉得也很说明这个问题,咱们就这么早说吧。就是说假设 10 年以后小扎想退休了,谁会接班?我认为大概率会是 Alexandr Wang。我认为就是说 Meta 他大概看到了一个很有意思的点,就是他认为未来 10 万亿公司的入场券,一定要掌握 AI 数据的能。我觉得好的数据是两个事的成绩,第一个事是多样性的场景,第二个事是高质量的人的示范。其实我当时在英伟达的时候,老黄在内部就说,NV is a simulation ...
小宇宙
Open in 小宇宙