scripod.com

Vol.59|对话千寻智能解浚源:机器人领域的 ChatGPT 时刻可能就在明年

开始连接 LinkStart

Shownote

【本期内容】 过去两年,多模态大模型在对世界理解上的进展,意外推动了一个新领域的进展:机器人。当模型能够理解世界,是不是离在世界中自由行动只差一步了? 本期播客,我们邀请到关注机器人通用操作能力的千寻智能具身智能项目负责人解浚源。 解浚源将为我们分享他为何认为具身智能已到拐点,千寻智能为何坚定选择「VLA 真机数据」这一路线,同时聊聊行业中的几个核心问题: * 目前机器人在操作能力上到底发展到了哪一步?具身智能商业化落地的窗口还有多远? * 为什么做具身智能大脑的公司也需要做机器人本体? * ...

Highlights

近年来,随着多模态大模型的快速发展,人工智能对现实世界的理解能力大幅提升,这也为机器人技术的进步带来了新的契机。当 AI 具备了感知和理解环境的能力,下一步便是如何在物理世界中实现自主行动。
03:02
千寻智能的机器人具备抗干扰能力,可完成柔性操作任务
09:14
轮式双臂机器人若参加拳击比赛,因其结构优势可能更具胜算
14:33
Pi0 这个 VLA 模型可能是个拐点,在复杂任务上表现出色
22:21
强化学习用于提升机器人操作性能,如从 95% 提升到 99%
27:04
当前机器人触觉设计需平衡精密性与耐用性
27:45
触觉要发挥效用,模型必须具备高速推理能力
31:38
简单动作只需几百到一千次操作即可学会
39:49
针对性收集机器人犯错数据比盲目增加数据量更高效
42:38
机器人数量达到万级可启动数据飞轮
55:15
高阳老师提及当前机器人领域的发展与硬件力控能力
55:35
工厂场景做单一任务是当前最快落地路径
1:01:37
传统机器人难以完成最初将螺丝对准螺孔的操作,仍需人工介入
1:03:26
特斯拉 DEMO 展示双足站立使用强化学习算法保持平衡
1:05:31
应本体与大脑同步迭代,而非等待本体收敛后再发展大脑
1:07:06
中国机器人行业有望在明年进入全球主线位置
1:10:19
三年后 R2 智能机器人能在高端场所从事复杂劳动

Chapters

机器人领域的发展与探索
00:00
为什么具身智能目前进入了爆发期?
03:02
机器人打拳击:宇树关注跌倒起身,千寻关注自动出拳
07:45
名词科普:端到端、VLA、模仿学习、强化学习
12:08
为什么说具身智能已经到了技术拐点?
19:38
人能操纵机器人做出的动作,机器人现在都能自己做了
22:49
机器人动作为什么这么慢?
27:45
总说缺数据,机器人到底需要多少数据?
31:31
仿真数据还是真机数据?
32:57
机器人的进化有数据飞轮吗?
41:05
基础模型做的够好,可以少采一个数量级的数据
46:49
内行看门道:什么动作对机器人更难?
50:14
两年内,L2 级别的机器人就可以实现商业化
55:30
为什么工厂里人形机器人还没有大规模替代人?
58:50
双足还是不双足?
1:02:19
为什么做机器人 AI 大脑的公司也需要做自己的机器人?
1:04:13
特斯拉的优势是有无限量的钱
1:07:05
机器人量产预测,没有理由比车贵
1:10:19

Transcript

Li Yuan: 本节目由极客公园制作播出。 解浚源: 是完全没有数据飞轮,也没有数据壁垒的,但是反倒是机器人这一边,实际上我认为是有数据飞轮的,机器人的动作为什么这么慢?他自己做了几个月这个事情以后,有一个比较清晰的答案。 Li Yuan: 离科技更近,让思考更深。大家好,欢迎来到开始连接 Linkstart。过去两年,多么太大模型在对世界理解上的进展,意外推动了一个新的领域,机器人。当模型能够理解世界,是不是离在世界中自由行动只差一步了?本期播客我们邀请到关注,机器人通用操作能力的千寻智能。具身智能项目...
小宇宙
Open in 小宇宙