scripod.com

106: 与真格戴雨森长聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need|Agent#1

晚点聊 LateTalk

Shownote

「两瓶茅台的价格体验未来,很划算(Devin 最低月订阅费 500 美元)」 2 月下旬,我与真格基金管理合伙人戴雨森长聊了一次 AI。 上周,真格投资的 Monica 发布的 Agent 产品 Manus,虽然还在内测阶段,就引起了大量关注。在聊这期时,雨森提到了 Monica 即将会发布一款 Agent 产品,那时候我们还不知道 Manus 将会席卷社交媒体。 当我们把一个任务交给 Manus,过了十几分钟收到完成的结果时,似乎真的感受到了一点 attention is not all you need 的未来。 带来这些变化的起点,是去年至今的两个重要节点:o1 和 R1。它们分别带来了两个对 AI 全行业的影响: 一是 o1 在大语言模型中引入强化学习,开启 Pretraining(预训练)Scaling Laws 之外的 Post-training(后训练)和 test-time-computing(即推理阶段的计算)阶段的新 Scaling Laws,让模型推理能力大幅提升。我们之前在第 80 期节目中也有详细讨论 o1,当时业界还普遍猜测 o1 用到了蒙特卡洛树搜索等方法。 二是与 o1 同为推理模型的 DeepSeek R1 强势开源,以极低的成本,和后续引发的巨大全民影响力,让很多人重估了大模型行业当前的最重要课题:提升模型能力。R1 的开源和同期发布了详细技术报告另一个推理模型的 Kimi-k1.5 ,也明确告诉整个领域,一些方向是 “此路不通”,他们都没有使用蒙特卡洛树搜索等方法。 这期节目,我们从 o1 和 R1 开始聊,二者一同带来的推理能力的提升、成本的下降,和同期模型编程能力与工具使用能力的提升,开启了 Agent 在 2025 年的应用前景。 雨森详细分享了他对 Agent 机会的当前观察,以及在 DeepSeek 带来的开源生态的变化中,大小 AI 公司的新动作和调整。 本期嘉宾: 戴雨森:真格基金管理合伙人,投资了 Kimi(月之暗面)、与爱为舞、无问芯穹、Genspark 等 AI 项目。 时间线: - OpenAI o 系列与 DeepSeek R 系列的启发 01:36 o1 证明 RL(强化学习)在后训练阶段和推理时间的 Scaling Law 潜力,为 Agent 产品形态奠定基础 04:24 DeepSeek-R1 启发:开源 + RL + 专注的胜利;本土年轻团队的力量;技术提升带来魔法体验,涌现商业模式 - 详聊 AI Agent 14:25 3 个能力提升带来 Agent 爆发机会:推理 + 编程 + 工具使用;凡是 RL 进入的领域,往往导致人类迅速超过人类,“我把这叫李世石时刻” 18:11 Attention is not all you need,“工作的 Scaling Law”:从 “注意力经济” 到 “无需注意力” 的范式转变,Agent 帮你干活 34:07 Agent 产品形态推演:从写(分析类)到读(操作),到 Agent 指挥 Agent 干活(多 Agent 协同);一个例子:Manus 为了获得凤凰城地铁时刻表,在找不到公开信息的情况下给相关部门写邮件。 45:44 Agent 机会属于谁?模型公司自己做,还是应用公司? 53:02 Agent 成本:成本下降、速度变快是必然;200 美元一个月的 ChatGPT-pro,500 美金一个月的 Devin,两瓶茅台的价格体验未来,很划算 - 开源带来的格局重塑 58:18 DeepSeek 强势开源下:字节与腾讯的不同动作 01:10:39 DeepSeek 长期的商业价值? 01:14:53 开源并非必选项 01:19:39 阿里的节奏:开源、开放 01:28:34 对六小虎:DeepSeek 的 “清场效应”;对更多应用公司,加速从 “黑莓时代” 到 “iPhone” 时代 01:35:45 对算力需求:总需求变大没争议,但算力结构的变化可能导致英伟达市值调整 - 为更快到来的 AGI 的未雨绸缪 01:44:59 一生中见证多次指数增长,历史罕见 01:51:32 希望 AI 普惠,但也有可能走向反面 01:54:40 戴雨森个人为 AGI 做的准备 02:04:01 最近的阅读推荐:A Brief History of Intelligence(作者:Max Bennet)、《第一只眼》(作者:Andrew Parker) 相关链接: 3 位连续创业者打造 Manus,应用潮里有更多 “underdog” 的机会(文末附 Manus、Open Manus 实测) (https://mp.weixin.qq.com/s/QXPx7efrGK2Y6msGTqAFlQ) 晚点聊 99:MiniMax 创始人闫俊杰:做大模型,千万别套用移动互联网的逻辑 (https://www.xiaoyuzhoufm.com/episode/678daf93cabd7f95693c8d6c?s = eyJ1IjoiNjBkODRlZTVlMGY1ZTcyM2JiNzdiOGYwIn0%3D) 晚点聊 100:硅谷怎么看 DeepSeek?与 FusionFund 创始人张璐聊开源、Agent 和除了 AI (https://www.xiaoyuzhoufm.com/episode/6799dea77c3a804d89fd93f2) 晚点聊 102:DeepSeek 启动开源周,大模型开源到底在开什么? (https://www.xiaoyuzhoufm.com/episode/67bd286dfd2cbe6cd771675d) 晚点聊 103:用 Attention 串起大模型优化史,详解 DeepSeek、Kimi 最新注意力机制改进 (https://www.xiaoyuzhoufm.com/episode/67bf356952a6af799c558399?s = eyJ1IjoiNjBkODRlZTVlMGY1ZTcyM2JiNzdiOGYwIn0%3D) 附录(本期中提及的一些 AI 产品): Devin:由 Cognition 开发的自动化编程助手 Agent。 DeepResearch:OpenAI 2025 年 2 月发布的为智能研究 Agent,支持深度信息检索与报告生成。 Manus:本期中提及的 Monica.im 当时即将发布的 Agent 产品,支持多任务自主执行。 ComputerUse:Anthropic 2024 年 11 月发布的通用计算机助手 Agent,允许 AI 操作计算机完成任务。 Cursor:由 Cursor 团队开发的 AI 编程助手。 Perplexity:由 Perplexity AI 开发的 AI 搜索引擎,能提供深度搜索、信息整合和答案生成。 剪辑制作:甜食 本期主播:小红书 @曼祺_火柴 Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token = YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw - EfCtqmFTkCIM2o=&xsec_source = app_share & xhsshare = CopyLink & appuid = 5dfa9e92000000000100626f & apptime = 1736682459 & share_id = 331aecb9ca7941f498d81fb9c32ea810),即刻 @曼祺_火柴 Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/% E6%92% AD% E5% AE% A2-% E7% BB%93% E5% B0% BE% E4% BD%9C% E8%80%85% E7% AD% BE% E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/% E6%92% AD% E5% AE% A2% E7% BB%93% E5% B0% BE% E6%88% AA% E5%9B% BE.png

Highlights

本期节目深入探讨了 AI 技术的快速发展及其对未来社会的影响,特别是 Agent 产品在 2025 年的应用前景。嘉宾戴雨森分享了对 o1 和 R1 两个重要节点的看法,以及它们如何推动 AI 推理能力的提升和成本下降。此外,还讨论了 DeepSeek 开源生态下,大小 AI 公司在 Agent 领域的新动作和调整。
00:02
Monica 将发布 Agent 产品 Manus,内测反响好,展现出解放人类注意力的潜力
02:55
训练模型如同培养聪明人,需基础素质好且有更多时间
11:30
未来的杀手应用可能是帮助用户省时间的产品
17:37
强化学习使 AI 在特定领域呈指数级成长,称为 “李世石时刻”
30:28
模型能力提高是技术革命解锁变化的前提
39:12
能写代码的 Agent 能力强大但需监控训练和对齐以防滥用
49:17
投入大量时间精力在某些方面会影响探索 AGI 的资源
57:30
AI 正在加速新药发现和科学探索进程
1:04:11
DeepSeek 的 R1 开源意义重大,在西方引起广泛反响
1:11:29
技术革命早期不应以成熟期标准衡量商业模式
1:16:59
O3 Mini 模型在长推理时间下表现优异,尺寸为 3.7B
1:26:44
专注长文本是 Kimi 成功的关键因素之一
1:34:46
DeepSeek 开源类似安卓时刻,推动生态繁荣
1:38:57
架构稳定后芯片可通过专有化提升效率,但架构是否固化存在争议
1:47:09
指数增长在 AI 领域的体现令人难以想象未来变化
1:52:21
新技术可能拉大贫富差距,但也创造新就业机会
2:02:56
开放技术限制能带来商业价值,如 GPS 政策的演变
2:06:21
AI 领域需不断竞争发展,这是生命、智能进化进步的原因

Chapters

AI Agent 应用前景与生态新动作
00:00
OpenAI o 系列与 DeepSeek R 系列的启发
o1 证明 RL(强化学习)在后训练阶段和推理时间的 Scaling Law 潜力,为 Agent 产品形态奠定基础
01:36
DeepSeek-R1 启发: 开源 + RL + 专注的胜利;本土年轻团队的力量;技术提升带来魔法体验,涌现商业模式
04:24
详聊 AI Agent
3 个能力提升带来 Agent 爆发机会: 推理 + 编程 + 工具使用;凡是 RL 进入的领域,往往导致人类迅速超过人类,“我把这叫李世石时刻”
14:25
Attention is not all you need,“工作的 Scaling Law”:从 “注意力经济” 到 “无需注意力” 的范式转变,Agent 帮你干活
18:11
Agent 产品形态推演: 从写(分析类)到读(操作),到 Agent 指挥 Agent 干活(多 Agent 协同);一个例子: Manus 为了获得凤凰城地铁时刻表,在找不到公开信息的情况下给相关部门写邮件。
34:07
Agent 机会属于谁?模型公司自己做,还是应用公司?
45:44
Agent 成本: 成本下降、速度变快是必然;200 美元一个月的 ChatGPT-pro,500 美金一个月的 Devin,两瓶茅台的价格体验未来,很划算
53:02
开源带来的格局重塑
DeepSeek 强势开源下: 字节与腾讯的不同动作
58:18
DeepSeek 长期的商业价值?
1:10:39
开源并非必选项
1:14:53
阿里的节奏: 开源、开放
1:19:39
对六小虎: DeepSeek 的 “清场效应”;对更多应用公司,加速从 “黑莓时代” 到 “iPhone” 时代
1:28:34
对算力需求: 总需求变大没争议,但算力结构的变化可能导致英伟达市值调整
1:35:45
为更快到来的 AGI 的未雨绸缪
一生中见证多次指数增长,历史罕见
1:44:59
希望 AI 普惠,但也有可能走向反面
1:51:32
戴雨森个人为 AGI 做的准备
1:54:40
最近的阅读推荐: A Brief History of Intelligence(作者: Max Bennet)、《第一只眼》(作者: Andrew Parker)
2:04:01

Transcript

曼祺: 欢迎收听本期晚点聊,今天的主播是曼琪。本期的出厂人物,还有真格管理合伙人戴雨森,和晚点的创始人小婉。这期节目也会发布在,真格基金的播客。此话当真中。这次聊是在 2 月下旬,当时宇森就提到了,真格投资的 Monica,即将会发布一款 agent 的产品。那时候我们还很难想象,上周开始内测的 Manus 将会席卷社交媒体。当我们开始测试 Manus,把一个任务交给他,过了十几分钟就收到完整的结果时,似乎真的感受到了一点。attention is not all you need。这里的 attentio...