scripod.com

140. 对姚顺宇的 4 小时访谈:请允许我小疯一下!在 Anthropic 和 Gemini 训模型、技术预测、英雄主义已过去

Shownote

姚顺宇戴了一副茶色眼镜走过来,这副眼镜会随光线变化而改变颜色。 硅谷 AI 业界有两位 Yao Shunyu,他们曾是清华同一届毕业生,这让姚顺雨与姚顺宇时常成为话题人物。 前一位姚顺雨 2025 年从 OpenAI 跳槽到腾讯,他去年来过我们节目(第 115 集);后一位姚顺宇也于同年跳槽,从 Anthropic 来到 Google DeepMind。 今天的嘉宾姚顺宇,毕业于清华和斯坦福大学,曾经的研究方向是理论物理 —— 非厄米系统、量子物理与高能物理。他的人生奋斗姿态是 ——“总想挑战一些自己不太会的事”。 他人生最大的...

Highlights

本期节目邀请到 AI 领域新锐研究科学家姚顺宇,他从理论物理跨界投身 AI 前沿,在 Anthropic 与 Google DeepMind 深度参与 Claude 和 Gemini 系列大模型研发。他以清醒的批判意识、扎实的科研底色与不拘一格的表达风格,为我们展开一幅 AI 产业演进的真实图景。
00:05
预训练本身就是一种大规模、自监督的强化学习
04:41
自己从朋友身上学到很多关于 AI 人机交互和产品相关事情
22:04
Manus 被 Meta 收购的最大价值是作为吸引中国及亚洲 AI 产品人才的新加坡锚点
28:34
预训练的 scaling law 未到头,多数人误判‘到头’实为实验 bug 或信念动摇所致
46:25
AI 虽好,但会使少部分人更强,大部分人失去独特价值,传统软件工程可能最终由千分之一的人完成所有人的工作并拿百倍工资
53:49
姚顺宇非常厉害
1:02:06
豆包语音效果好,可能是世界最好之一,认为这主要是模型的事
1:09:38
机器人进展还没到 GPT 1 的阶段,大家还没想明白如何扩展
1:13:57
中考前决定去‘underdog 之地’赌一把搞竞赛,原因是想体验其挑战性,认为比普通学习更有挑战
1:35:22
数值与理论不符是重大发现的起点
1:42:30
在伯克利博后仅待两周就辞职,只为全力转向 AI
1:52:35
AI 研究如同 17 世纪热力学,依赖经验定律而非完备科学解释
2:11:22
Claude 3.7 对 Anthropic 的后训练是分水岭,此前处于小规模修修补补状态
2:36:22
AI 将自主实验,未来 6 到 12 个月迎来关键突破
3:01:26
预训练正成为可管控的工程项目,而后训练更依赖自下而上的广泛尝试
3:02:46
预训练数据分布广但质量要求不高,后续训练数据分布窄但质量要求高
3:10:24
世界模型定义不清晰,不同人所指不同
3:16:38
评价框架易被 hack,值得信赖的人会思考做事效果及遗漏因素
3:29:13
AI 行业个人英雄主义时代已过去,从业者最重要的特质是靠谱、做事细、对自己做的事负责

Chapters

AI 本质简单,预训练即强化学习
00:00
两个 Shunyu Yao
02:41
竞争与逃逸
06:50
“Pre-train 没有到头”
26:37
Coding 的爆发
36:23
字节和豆包
51:25
"硬蒸" 和 "聪明的蒸"
54:45
机器人
1:05:22
在 Underdog 之地赌一把
1:10:00
非厄米系统与量子物理
1:20:59
高能物理
1:37:42
物理与 AI
1:44:24
在 Anthropic 训练 Claude 3.7、4.5
1:53:47
"AI 本质是简单的"
2:36:18
在 Google DeepMind 训练 Gemini 3
2:42:25
"Pre-train 也是一种 RL"
3:02:43
技术预测
3:08:04
组织搭建
3:14:06
集体主义胜利
3:24:48

Transcript

张小珺: Hello 大家好,我是张小珺。AI 业界有两个姚顺宇,一个从 OpenAI 跳槽到了腾讯,一个从 Anthropic 跳槽到了 Google DeepMind。前一位姚顺宇去年来过我们节目,那今年我们邀请了另外一位,这位姚顺宇毕业于清华和斯坦福大学,曾经的研究方向包括非厄米系统,量子物理和高能物理。毕业后从物理转战 AI。2024 年加入 Anthropic,2025 年跳槽到了 Google DeepMind 出任研究科学家参与了 Claude 3.7,4.5,Gemini 3 等模型的开发过...
小宇宙
Open in 小宇宙