41. 对话智源院长王仲远:关于世界模型,AI 与物理世界,与大模型的最前沿
卫诗婕|漫谈Light the Star
2025/07/01
41. 对话智源院长王仲远:关于世界模型,AI 与物理世界,与大模型的最前沿
41. 对话智源院长王仲远:关于世界模型,AI 与物理世界,与大模型的最前沿

卫诗婕|漫谈Light the Star
2025/07/01
Shownote
Shownote
创新应该以何种方式被规划?三年前,我曾经写下过一个中国式尝试 ——2023 年,在中国大模型正如火如荼的时候,我曾专访过智源研究院创始理事长、美国国家工程院外籍院士张宏江博士。(👉《对话智源张宏江:功成不必在我,能成为黄埔军校很好》) 作为一家非营利机构,智源效仿 OpenAI,是一家独立于政府、商业和高校之外的新型科研机构 ——2018 年,前微软亚洲研究院创始人之一、刚从金山 CEO 的位置上退休的张宏江主导了这一切。 在宏江博士看来,真正的科研创新需要让年轻学者在最有热忱和动力的年龄展开真正高效的学术研究...
Highlights
Highlights
人工智能的发展正在以前所未有的速度推进,而在这场技术变革中,年轻科研力量的崛起尤为引人注目。本期节目围绕中国领先的人工智能研究机构 —— 智源研究院展开,探讨其如何通过支持青年学者推动前沿科技探索,并回顾其从大语言模型到世界模型的技术演进路径。
Chapters
Chapters
AI 的未来属于年轻人
00:00Part 0. 前言:智源是一所什么样的机构?
智源作为一家非营利研究机构,为什么坚定地选择押注年轻人?
04:14首位「85 后」院长的诞生
07:08为什 AI 是年轻人的事业?「年轻人没有失败」
08:58仲远加入智源:小学三年级女孩的提问,直击我的心灵
12:31Part 1. 关于仲远:从微软、Facebook 到美团、快手
微软要求员工,要以最高的道德标准行事
16:50美团王兴:苦练基本功 —— 细节抓到极致,就是基本功
17:35什么是知识图谱?为什么仲远很快就做出了搜索结果的大幅优化?
19:13人大孟小常教授教会我:研究与系统并重
20:482010-2016,深度学习飞速发展,「我在亚研院,意识到自己与社会有些脱节」
22:23Facebook:move fast ,break things
25:27快与慢的哲学
25:59同理心、 growth mindset 与「练心智」
31:16愚昧之巅、绝望之谷、开悟之坡
35:32Part 2. 过去十多年,深度学习的发展趋势 ——「大一统」正在发生
2018 年,企业用 Transformer 还是有争议,但深度学习已经开始要「大一统」了
41:32Transformer 「大一统」,意味着什么?
42:45跨模态、多模态与全模态 —— 为什么业内人常说,此多模态非彼多模态?
44:50越简单、统一的架构,会有越强的生命力
48:57Part 3. 智源的趋势预测:从大语言模型,到原生多模态世界模型
智源的大模型趋势预测:从语言到多模态,再到巨量智能和 AI for science,最终到世界模型
49:17多模态数据到底能否提升大模型的智能?这在学术界和产业界是有争论的
53:28这取决于智能的定义:动物没有语言体系,也有它们的智能
54:45「人类的学习过程和现在大语言模型的发展路径是不一样的」
55:58以语言为核心的大模型训练常遇到问题:加入其他模态后,模型的智能水平似乎退化了
58:22「原生多模态大模型,它能够越来越接近人类的大脑」
1:01:13智源推出的大模型系列:从「悟道」(大语言系列模型)到「悟界」(原生多模态世界模型)
1:02:12Part 4. 关于世界模型的争论、多样的技术路线,与智源的信仰
什么是世界模型?LeCun (图灵奖得主)早在 2023 年的智源大会就提出过,但智源信仰的世界模型路线与 LeCun 稍有不同
1:04:12今年的智源大会上,两大图灵奖得主(Yoshua Bengio 与 Richard Sutton)所信仰的技术路线针锋相对
1:09:07仲远的技术路线预测:基于海量数据训练的基础模型打底,通过强化学习做后训练,推理的 Scaling Law 还会持续
1:11:41这条路线在现实世界有观察到:两岁的小女孩自己会拆糖果了
1:12:46失败也是创新的一部分,智源做的是创新的「土壤」
1:14:31Part 5. 具身智能、世界模型的价值与应用、以及「真开源」
为什么今年,具身智能特别火?
1:17:252025 智源的两大重点:原生多模态和具身智能,为什么这么选?
1:20:43机器人最强大脑、空间任务和智能化
1:23:01原生多模态和具身智能模型,都是世界模型,还是都组成了世界模型?
1:27:21Meta 的 V-Jeppa 2 登顶 HuggingFace 榜首,超越 GPT-4o,世界模型的趋势要来了?
1:27:52智源开源的一系列大模型,被应用的情况如何?
1:29:42仲远上任后,为什么倡导「真开源」?
1:32:16Part 5. 对于未来,仲远给出哪些确定性的趋势预判?
OpenAI 华人研究院姚顺雨:AI 正在进入中场休息?
1:34:45大语言模型领域的确如此,世界模型的上限还很高
1:35:43智源能给出的确定性趋势判断:AI 将正式从数字世界迈向物理世界
1:37:41智源要跟世界顶尖的学术研究机构掰掰手腕?
1:38:02南坡北坡,「南坡这边风景一定会很好」
1:39:21Transcript
Transcript
卫诗婕: she was only 21。
王仲远: but so much older than she was now。愚昧之巅,绝望之谷,开悟之波。
卫诗婕: 你经历过绝望之谷吗?
王仲远: 肯定经历过,但我不想分享。我开始意识到一点,人工智能,深度学习,它有可能要开始大一统了。越简单的结构,越统一的结构,它会有越强的生命力。能否提升智能,非常取决应对智能的定义。对于很多的动物来讲,它没有语言体系。
卫诗婕: 它也有它的智能。
王仲远: 对,仅有语言模型是远远不够的。能力智能将正式地从数字世界,迈向物...

Open in 小宇宙