scripod.com

41. 对话智源院长王仲远:关于世界模型,AI 与物理世界,与大模型的最前沿

人工智能的发展正在以前所未有的速度推进,而在这场技术变革中,年轻科研力量的崛起尤为引人注目。本期节目围绕中国领先的人工智能研究机构 —— 智源研究院展开,探讨其如何通过支持青年学者推动前沿科技探索,并回顾其从大语言模型到世界模型的技术演进路径。
智源研究院作为一家非营利性科研机构,始终坚持将舞台交给年轻人,鼓励他们进行敢于失败、长期投入的技术探索。2020 年启动的「悟道」项目成为后来中国大模型创业潮的重要起点。如今,研究院已迈入原生多模态和世界模型的新阶段,并发布了「悟界」系列模型。院长王仲远强调,AI 是年轻人的事业,因其无传统束缚、更具创新潜力。他还分享了自己在微软、Facebook、美团和快手的工作经历,以及对具身智能、世界模型等未来趋势的判断。他认为,AI 将正式从数字世界迈向物理世界,而构建理解真实世界的 “世界模型” 将成为通向 AGI 的重要路径。
00:00
00:00
人工智能可能走向大一统结构,智能将从数字世界迈向物理世界
04:22
04:22
刘知远感谢智源给予机会运作千万级资源项目
08:28
08:28
院长需具备快速出结果的能力并建体系
10:28
10:28
张宏江提到‘工程不必在我’,强调筛选人才时考量技术理想的重要性
15:19
15:19
讲述者意识到原本认为需四五十年实现的技术场景可能五到十年就会触及
16:57
16:57
有能力但道德不过关的人对社会危害更大
17:39
17:39
拉长周期看很多失败源于基本功不扎实
20:48
20:48
首次感受到学术研究的快感和激动
23:55
23:55
王仲远称 Facebook 是真正的互联网公司,发展快、工作风格不同
25:30
25:30
想法很快变成产品供全球数十亿用户使用
29:50
29:50
选拔有短期成果的人才可建立正向资源获取循环
34:12
34:12
失败应互相成全,鼓励挺过人生艰难
38:30
38:30
职业生涯中只图短期成果将阻碍长期成长
42:47
42:47
不同模态使用统一架构后可实现意想不到的融合效果
47:26
47:26
全模态设计受人类大脑启发,追求统一结构实现模态融合
49:11
49:11
智源预测 AI 将向世界模型方向发展
50:36
50:36
若机器智能超人类,其创造的数据或可用于大语言模型试验
53:32
53:32
自然语言处理是人工智能皇冠上的明珠
54:45
54:45
多模态数据是人工智能未来突破的关键
1:00:47
1:00:47
原生多模态大模型更接近人类大脑,能感知、理解和交互世界
1:03:34
1:03:34
多模态尤其是原生多模态可能推动机器人实现真正具身智能
1:08:14
1:08:14
用简单易扩展结构训练基础模型是技术信仰
1:12:20
1:12:20
具身智能通过体验学习记住技能
1:12:46
1:12:46
儿童通过手机视频自主学习,预示未来多模态智能的发展趋势
1:14:31
1:14:31
即便失败也应被包容,好的创新环境应鼓励可能失败的科研尝试
1:17:27
1:17:27
具身智能将开启硅基生命与碳基生命共存的新可能
1:21:56
1:21:56
聚生大脑能显著提升硬件智能化水平,具备泛化性和复杂任务规划能力
1:31:10
1:31:10
己方开源数据被超 30 个国家和地区、数百个机构使用
1:33:47
1:33:47
关键技术可基于个人理解、判断、兴趣和热情去做
1:34:48
1:34:48
从解决问题转向定义问题标志着 AI 发展的新阶段
1:37:41
1:37:41
人工智能将从数字世界迈向物理世界
1:46:28
1:46:28
智源研究院发布悟界 BrainMill 键维模型,基于统一架构训练多种脑信号产生意外效果