scripod.com

127: 与真格戴雨森 25 AI 中场复盘:OpenAI 的 IMO 金牌、Kimi K2 翻盘、Agent 普及和抢人大战

晚点聊 LateTalk
本期节目由《晚点聊》主持人程曼祺与真格基金管理合伙人戴雨森共同回顾 2025 年 AI 领域的发展与未来趋势。节目分为两次录制,首次聚焦于月之暗面 K2 模型的发布与 AI 应用的普及趋势,第二次则补充讨论了 OpenAI 在 7 月 18 日发布的 ChatGPT Agent,以及其通用大语言模型在 IMO 国际数学奥林匹克竞赛中取得金牌的突破性进展。嘉宾从技术、人才、产品等多个维度,深入剖析了 AI 行业的最新动态与长期趋势。
节目中重点讨论了 OpenAI 通用模型在 IMO 竞赛中取得金牌的里程碑意义,标志着 AI 在推理能力上的显著提升。此外,AI 应用的普及正在加速,尤其是在编程、多模态交互和 Agent 形态方面取得实质进展。尽管机器人落地速度被高估,但模型与应用的协同进化仍被普遍看好。各大公司如 Google、OpenAI、Anthropic 等正围绕模型、工具与原生应用展开激烈竞争。人才争夺、组织结构调整和上下文工程成为行业焦点。未来几个月,L3 级 AI 模型与全栈 Agent 应用的发展将成为关键观察点,AI 正逐步从辅助工具向任务主导者演进。
00:50
00:50
通用大语言模型已达到 IMO 金牌水平
01:06
01:06
OpenAI 模型在 IMO 竞赛中获得金牌,六道题做对五道,未联网、未专门优化、未使用工具
15:49
15:49
腾讯从通义、字节 Seed 组织挖人,人才争夺持续
17:49
17:49
中国 AI 公司在做 PPT 等任务上结果优于 ChatGPT Agent
31:30
31:30
L3 模型帮助 Agent 应用输出更丰富内容并提升用户体验
36:15
36:15
Kimi K2 是目前最好的开源大模型
41:51
41:51
与其免费喝奶茶不如训练大模型
45:43
45:43
解决 corner case 和修 bug 对冲击下一代模型帮助不大
48:50
48:50
Kimi 团队基于稳定成员和长期信任,成功推出 K2 模型
1:04:02
1:04:02
Google DeepMind 凭借人才与 TPU 在 AI 领域展现竞争力
1:15:23
1:15:23
嘉宾表示每月 AI 产品订阅花费接近 1000 美金,多为最高级版本
1:23:19
1:23:19
Kimi 在模型训练中加入更多工具使用能力以提升 Agent 表现
1:34:31
1:34:31
硅谷买人式收购反映竞争激烈,大公司愿用钱换时间与竞争优势
1:37:38
1:37:38
只要 benchmark 出现,AI 进展就很快
1:42:11
1:42:11
强调应推出对用户有价值的产品,减少空洞营销
1:48:26
1:48:26
找到好方向的应用创业不应放弃,因大趋势非一年能走完
1:53:46
1:53:46
AI 或将助力科研人员加速科学发现