140. 对姚顺宇的 4 小时访谈:请允许我小疯一下!在 Anthropic 和 Gemini 训模型、技术预测、英雄主义已过去
张小珺Jùn|商业访谈录
3 DAYS AGO
140. 对姚顺宇的 4 小时访谈:请允许我小疯一下!在 Anthropic 和 Gemini 训模型、技术预测、英雄主义已过去
140. 对姚顺宇的 4 小时访谈:请允许我小疯一下!在 Anthropic 和 Gemini 训模型、技术预测、英雄主义已过去

张小珺Jùn|商业访谈录
3 DAYS AGO
本期节目邀请到 AI 领域新锐研究科学家姚顺宇,他从理论物理跨界投身 AI 前沿,在 Anthropic 与 Google DeepMind 深度参与 Claude 和 Gemini 系列大模型研发。他以清醒的批判意识、扎实的科研底色与不拘一格的表达风格,为我们展开一幅 AI 产业演进的真实图景。
姚顺宇指出 AI 本质简单,其核心可统一理解为强化学习 —— 预训练本身即大规模自监督 RL 过程;个人英雄主义时代已然终结,成功依赖系统性工程能力与集体协作,从业者最核心特质是‘靠谱’:交付稳定、可预期的结果。他剖析了中美技术路径差异:中国依托工程优化与创新蒸馏加速追赶,聚焦响应速度与生活场景;美国更重智能上限与思维深度。在编程、数学、机器人等领域的进展显示,AI 正快速渗透反馈清晰的任务,但在价值判断模糊的领域仍显乏力。他强调物理训练赋予的系统性思维与刨根问底精神,比具体工具更适配 AI 研发;而 AI 的快速实验迭代特性,复现了物理学中理论与实验交融的活力。最后,他呼吁摒弃对个体神话的迷思,拥抱集体主义胜利 —— 真正的突破来自高质量数据构建、跨职能协同与对现实影响负责的务实执行。
00:05
00:05
预训练本身就是一种大规模、自监督的强化学习
04:41
04:41
自己从朋友身上学到很多关于 AI 人机交互和产品相关事情
22:04
22:04
Manus 被 Meta 收购的最大价值是作为吸引中国及亚洲 AI 产品人才的新加坡锚点
28:34
28:34
预训练的 scaling law 未到头,多数人误判‘到头’实为实验 bug 或信念动摇所致
46:25
46:25
AI 虽好,但会使少部分人更强,大部分人失去独特价值,传统软件工程可能最终由千分之一的人完成所有人的工作并拿百倍工资
53:49
53:49
姚顺宇非常厉害
1:02:06
1:02:06
豆包语音效果好,可能是世界最好之一,认为这主要是模型的事
1:09:38
1:09:38
机器人进展还没到 GPT 1 的阶段,大家还没想明白如何扩展
1:13:57
1:13:57
中考前决定去‘underdog 之地’赌一把搞竞赛,原因是想体验其挑战性,认为比普通学习更有挑战
1:35:22
1:35:22
数值与理论不符是重大发现的起点
1:42:30
1:42:30
在伯克利博后仅待两周就辞职,只为全力转向 AI
1:52:35
1:52:35
AI 研究如同 17 世纪热力学,依赖经验定律而非完备科学解释
2:11:22
2:11:22
Claude 3.7 对 Anthropic 的后训练是分水岭,此前处于小规模修修补补状态
2:36:22
2:36:22
AI 将自主实验,未来 6 到 12 个月迎来关键突破
3:01:26
3:01:26
预训练正成为可管控的工程项目,而后训练更依赖自下而上的广泛尝试
3:02:46
3:02:46
预训练数据分布广但质量要求不高,后续训练数据分布窄但质量要求高
3:10:24
3:10:24
世界模型定义不清晰,不同人所指不同
3:16:38
3:16:38
评价框架易被 hack,值得信赖的人会思考做事效果及遗漏因素
3:29:13
3:29:13
AI 行业个人英雄主义时代已过去,从业者最重要的特质是靠谱、做事细、对自己做的事负责