scripod.com

106. 和王鹤聊,具身智能的学术边缘史和资本轰炸后的人为乱象

Shownote

今天继续《商业访谈录》的机器人专场,嘉宾是北京大学助理教授、银河通用创始人兼 CTO 王鹤。 王鹤毕业于清华和斯坦福大学。他给我们从 “具身智能” 的学术缘起开始聊起,这是一个学术流派从一个学科中萌芽到边缘再到主流渗透的全过程。 而随着 ChatGPT 诞生,“具身智能” 这个小众概念,在过去 2 年成了新的资本宠儿 —— 但一时间,也带来了新的乱象。 我们探讨了一些具身智能产业界关键问题: 1 / 具身智能起源于计算机视觉的学术流派,视觉、语言、智能的关系是什么?为什么 VLM(视觉语言模型)的表现显著弱于 LLM(大语言模型...

Highlights

本期节目聚焦于具身智能的学术起源与产业应用,探讨了其从边缘学科到主流技术的发展历程。嘉宾王鹤作为北京大学助理教授和银河通用创始人,分享了具身智能在机器人领域的关键问题及其未来前景。
04:25
20 年底拿到北大 offer 后全身心投入具身智能研究
18:59
智能的本质是与环境交互的应对方式
30:06
视觉驱动机器人成为具身智能领域共识
1:07:36
类别级物体位姿估计是当前具身智能发展的关键技术
1:41:51
VLM 训练水平不如 LLM,本质是数据不够,目前还难以做到无所不能。
1:54:25
具身机器人技术不成熟,头部企业与中腰部差距巨大,数据采集是关键。
2:03:30
Simulator 加入视觉模态能实现 Sim-to-Real,2023 年推出完全泛化的抓取方法
2:19:30
中国因老龄化少子化需推动人形机器人发展,否则将面临极大劳动力缺口
2:25:33
若合成数据走通,NVIDIA 能撑起具身智能半边天
2:32:12
学好物理能提升思维水平,阅读《时间简史》有助于探寻事物本质

Chapters

机器人专场:具身智能与 AI 未来
00:00
开始的自问自答
03:00
语言不是智能的本质,而是 “一次跃变”
05:58
具身智能的学术边缘史
25:08
我的学术之路
41:15
具身智能的软件和硬件是螺旋上升的问题
1:25:08
我们要避免陷入以下泥潭
1:44:34
具身智能是,“生产力即产品”
1:55:17
资本轰炸后的人为乱象
2:13:51
一个插曲
2:25:25
最后的快问快答
2:28:26

Transcript

王鹤: 所以这个事是我们现在特别强调的,不要去搞一些砸我们行业招牌的事情了。比如承诺别人,你踩了就能训出来,你建厂你就能够有技能,我卖机器人你来踩,你踩你来训。明天他就是你的员工。这些模式是很可怕的,这些模式是在砸这个行业的饭碗。就第一件事公开展示,而且不允许遥操,国内的现在有些人难得特别大,他现在敢不告诉别人我是遥操,但实际是遥操。因为五年如果我们都不能形成万台级的规模化生产力,我们这个领域被蒸发了。 张小珺: 泡沫,全是泡沫。去年不是你跟黄仁勋坐在一起吗,你们聊了啥? 王鹤: 他也能吃一点辣的,我原来以...
小宇宙
Open in 小宇宙