106: 与真格戴雨森长聊 Agent：各行业都会遭遇 “李世石时刻”，Attention is not all you need|Agent#1

晚点聊 LateTalk

2025/03/09

Overview Shownote Highlights Transcript Chapters Pins

Shownote

「两瓶茅台的价格体验未来，很划算（Devin 最低月订阅费 500 美元）」 2 月下旬，我与真格基金管理合伙人戴雨森长聊了一次 AI。上周，真格投资的 Monica 发布的 Agent 产品 Manus，虽然还在内测阶段，就引起了大量关注。在聊这期时，雨森提到了 Monica 即将会发布一款 Agent 产品，那时候我们还不知道 Manus 将会席卷社交媒体。当我们把一个任务交给 Manus，过了十几分钟收到完成的结果时，似乎真的感受到了一点 attention is not all you need 的未来。带来这些变化的起点，是去年至今的两个重要节点：o1 和 R1。它们分别带来了两个对 AI 全行业的影响：一是 o1 在大语言模型中引入强化学习，开启 Pretraining（预训练）Scaling Laws 之外的 Post-training（后训练）和 test-time-computing（即推理阶段的计算）阶段的新 Scaling Laws，让模型推理能力大幅提升。我们之前在第 80 期节目中也有详细讨论 o1，当时业界还普遍猜测 o1 用到了蒙特卡洛树搜索等方法。二是与 o1 同为推理模型的 DeepSeek R1 强势开源，以极低的成本，和后续引发的巨大全民影响力，让很多人重估了大模型行业当前的最重要课题：提升模型能力。R1 的开源和同期发布了详细技术报告另一个推理模型的 Kimi-k1.5 ，也明确告诉整个领域，一些方向是 “此路不通”，他们都没有使用蒙特卡洛树搜索等方法。这期节目，我们从 o1 和 R1 开始聊，二者一同带来的推理能力的提升、成本的下降，和同期模型编程能力与工具使用能力的提升，开启了 Agent 在 2025 年的应用前景。雨森详细分享了他对 Agent 机会的当前观察，以及在 DeepSeek 带来的开源生态的变化中，大小 AI 公司的新动作和调整。本期嘉宾：戴雨森：真格基金管理合伙人，投资了 Kimi（月之暗面）、与爱为舞、无问芯穹、Genspark 等 AI 项目。时间线： - OpenAI o 系列与 DeepSeek R 系列的启发 01:36 o1 证明 RL（强化学习）在后训练阶段和推理时间的 Scaling Law 潜力，为 Agent 产品形态奠定基础 04:24 DeepSeek-R1 启发：开源 + RL + 专注的胜利；本土年轻团队的力量；技术提升带来魔法体验，涌现商业模式 - 详聊 AI Agent 14:25 3 个能力提升带来 Agent 爆发机会：推理 + 编程 + 工具使用；凡是 RL 进入的领域，往往导致人类迅速超过人类，“我把这叫李世石时刻” 18:11 Attention is not all you need，“工作的 Scaling Law”：从 “注意力经济” 到 “无需注意力” 的范式转变，Agent 帮你干活 34:07 Agent 产品形态推演：从写（分析类）到读（操作），到 Agent 指挥 Agent 干活（多 Agent 协同）；一个例子：Manus 为了获得凤凰城地铁时刻表，在找不到公开信息的情况下给相关部门写邮件。 45:44 Agent 机会属于谁？模型公司自己做，还是应用公司？ 53:02 Agent 成本：成本下降、速度变快是必然；200 美元一个月的 ChatGPT-pro，500 美金一个月的 Devin，两瓶茅台的价格体验未来，很划算 - 开源带来的格局重塑 58:18 DeepSeek 强势开源下：字节与腾讯的不同动作 01:10:39 DeepSeek 长期的商业价值？ 01:14:53 开源并非必选项 01:19:39 阿里的节奏：开源、开放 01:28:34 对六小虎：DeepSeek 的 “清场效应”；对更多应用公司，加速从 “黑莓时代” 到 “iPhone” 时代 01:35:45 对算力需求：总需求变大没争议，但算力结构的变化可能导致英伟达市值调整 - 为更快到来的 AGI 的未雨绸缪 01:44:59 一生中见证多次指数增长，历史罕见 01:51:32 希望 AI 普惠，但也有可能走向反面 01:54:40 戴雨森个人为 AGI 做的准备 02:04:01 最近的阅读推荐：A Brief History of Intelligence（作者：Max Bennet）、《第一只眼》（作者：Andrew Parker）相关链接： 3 位连续创业者打造 Manus，应用潮里有更多 “underdog” 的机会（文末附 Manus、Open Manus 实测） (https://mp.weixin.qq.com/s/QXPx7efrGK2Y6msGTqAFlQ) 晚点聊 99：MiniMax 创始人闫俊杰：做大模型，千万别套用移动互联网的逻辑 (https://www.xiaoyuzhoufm.com/episode/678daf93cabd7f95693c8d6c?s = eyJ1IjoiNjBkODRlZTVlMGY1ZTcyM2JiNzdiOGYwIn0%3D) 晚点聊 100：硅谷怎么看 DeepSeek？与 FusionFund 创始人张璐聊开源、Agent 和除了 AI (https://www.xiaoyuzhoufm.com/episode/6799dea77c3a804d89fd93f2) 晚点聊 102：DeepSeek 启动开源周，大模型开源到底在开什么？ (https://www.xiaoyuzhoufm.com/episode/67bd286dfd2cbe6cd771675d) 晚点聊 103：用 Attention 串起大模型优化史，详解 DeepSeek、Kimi 最新注意力机制改进 (https://www.xiaoyuzhoufm.com/episode/67bf356952a6af799c558399?s = eyJ1IjoiNjBkODRlZTVlMGY1ZTcyM2JiNzdiOGYwIn0%3D) 附录（本期中提及的一些 AI 产品）： Devin：由 Cognition 开发的自动化编程助手 Agent。 DeepResearch：OpenAI 2025 年 2 月发布的为智能研究 Agent，支持深度信息检索与报告生成。 Manus：本期中提及的 Monica.im 当时即将发布的 Agent 产品，支持多任务自主执行。 ComputerUse：Anthropic 2024 年 11 月发布的通用计算机助手 Agent，允许 AI 操作计算机完成任务。 Cursor：由 Cursor 团队开发的 AI 编程助手。 Perplexity：由 Perplexity AI 开发的 AI 搜索引擎，能提供深度搜索、信息整合和答案生成。剪辑制作：甜食本期主播：小红书 @曼祺_火柴 Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token = YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw - EfCtqmFTkCIM2o=&xsec_source = app_share & xhsshare = CopyLink & appuid = 5dfa9e92000000000100626f & apptime = 1736682459 & share_id = 331aecb9ca7941f498d81fb9c32ea810)，即刻 @曼祺_火柴 Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/% E6%92% AD% E5% AE% A2-% E7% BB%93% E5% B0% BE% E4% BD%9C% E8%80%85% E7% AD% BE% E5%90%8D.png ☆《晚点聊 LateTalk》建立「播客听友群」啦！☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流，第一时间收听新节目。这里有更多互动，更多话题讨论。欢迎贡献选题 & 推荐嘉宾。请先添加「晚点」小助手的微信号，备注：“晚点聊”，我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》，阅读更多商业、科技文章： https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/% E6%92% AD% E5% AE% A2% E7% BB%93% E5% B0% BE% E6%88% AA% E5%9B% BE.png

Highlights

本期节目深入探讨了 AI 技术的快速发展及其对未来社会的影响，特别是 Agent 产品在 2025 年的应用前景。嘉宾戴雨森分享了对 o1 和 R1 两个重要节点的看法，以及它们如何推动 AI 推理能力的提升和成本下降。此外，还讨论了 DeepSeek 开源生态下，大小 AI 公司在 Agent 领域的新动作和调整。