scripod.com

E191|小而美的机会来了,聊聊这轮 AI Agent 进化新范式

硅谷101

2025/05/16
硅谷101

硅谷101

2025/05/16

Shownote

进入 2025 年,AI Agent 仿佛按下了加速键:从 OpenAI 推出自助浏览器 Operator,到 Manus 爆火出圈并获 7500 万美元融资。究竟是什么引爆了这轮 AI Agent 的热潮? 代码能力的提升为 AI Agent 的奠定了基础,RFT(强化学习微调)带来了大模型的 “AlphaGo” 时刻,嘉宾甚至都感叹 “时代变了,开发产品成本低得有点恐怖”。但通用 AI Agent 是否真的是未来?数据壁垒、用户认知成本以及网络效应的缺失,都可能成为其发展的桎梏。 或许,更具前景的是那些深耕垂直领域的 “小而美” 的 Agent?本期节目,我们将一同探讨 AI Agent 的核心技术、热门产品体验、创业机会与挑战,以及 AI Agent 的未来将走向何方? 【主播】 泓君 Jane,硅谷 101 创始人,播客主理人 【嘉宾】 陶芳波,MindVerse 心识宇宙创始人 侯泰羽(Kolento Hou),纽约大学本科应用心理学,AI 产品经理 【你将听到】 RFT 推动的 Agent 热潮 00:05 AI Agent 进展大事件以及爆发三大核心原因 04:55 机器学习视角下的 Agent 进化 06:36 RFT(强化学习微调)技术促使 Agent 在 2025 年具有智能 08:10 大语言模型的 AlphaGo 时刻:不仅具有思考能力,还根据环境反馈调整学习 11:04 过去半年新趋势:Agent 在环境中完成任务 14:27 OpenAI Operator 买菜的体验:速度慢、准确率不高 17:32 内化工作流:新一代 Agent 能做出临场反应 20:55 创造虚拟环境:Scrapybara 帮我买秋裤 22:39 Cursor 与 Windsurf 编程 Agent 为何出圈? 26:11 AI 创业门槛降低,可以做平台上那些小而美的 Agent Manus 32:53 Manus 擅长广度,Deep Research 擅长深度 38:05 Agent 爆火背后的秘密:Sonnet 3.5 代码质量的提升 40:57 比训练更重要?Evaluation 的三代进化 44:02 SFT 更便宜,RFT 效果更优,行业会如何选择? 45:41 通用型 Agent 的双刃剑 垂类 AI Agent 推荐 48:45 在关键场景请求人类对齐:Replit 和 Fellou 的优秀交互体验 50:13 最看好 Cursor,有成为通用 Agent 的潜力 52:25 Vantel:每周帮保险经纪人省 10 小时的保险垂类 Agent 53:29 Sweetspot:换了八九个邮箱也要用的,辅助申请资助类 Agent 54:23 Gamma:秒杀 Canva 的 PPT 设计类 Agent 行业快与慢 57:48 做的 200 多个 Agent 中,商业化成功的案例 59:20 “越做发现问题越多”:离普通人每天使用 Agent 仍有距离 1:00:39 MCP 的生态建设需以年为单位 【相关名词解释】 RFT:Reinforcement Fine-Tuning,强化学习微调 SFT:Supervised Fine-Tuning,监督学习微调 MCP:Model Context Protocol,模型上下文协议 【监制】 泓君 【后期】 AMEI 【运营】 孙泽平、Meisi、王梓沁 【BGM】 Anticipating a New Day - Stationary Sign City Phases STEMS INSTRUMENTS - John Abbot Hidden Agenda Clockmaker's Daydream - 369 【在这里找到我们】 公众号:硅谷 101 收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓 FM|网易云音乐|QQ 音乐 其他平台:YouTube|Bilibili 搜索「硅谷 101 播客」 联系我们:podcast@sv101.net Special Guests: Kolento and 陶芳波.

Highlights

2025 年,AI Agent 领域迎来了快速发展,从 OpenAI 推出 Operator 到 Manus 获得巨额融资,这一波热潮引发了广泛关注。本期节目探讨了 AI Agent 的核心技术、热门产品体验以及未来发展方向。
04:04
陶芳波认为 agent 时代已至,基础设施组件渐完备
05:01
Agent 像人能独立完成任务,由大语言模型或推理模型驱动
06:40
强化学习和注入思考能力让 agent 在特定领域自主学习
10:42
大模型学会自主寻找路径解决问题,如解数学或编程题
11:10
很多公司训练模型失败,因模型未在电脑操作环境中训练。
15:20
Agent 通过分解操作并用强化学习微调提升性能
18:47
参数化智能使 AI 能灵活应对动态变化
20:58
Scrapybara 通过 API 提供即时安全的虚拟环境
25:06
开发者利用 AI 修改笔记以优化系统设计架构
30:24
Manus 的记忆功能使其能记住用户指令并在任务执行时与人对齐
33:54
Manus 展示了处理步骤,用户可灵活打断并使用 Jump to Live 功能
38:07
Sonnet 3.5 可通过 coding 生成漂亮表格并操作数据和环境
41:53
AI Agent 的每次响应生成和执行都应经过评估机制
44:09
RFT 技术效果更好,成为多数创业者首选
46:45
Manus 网络效应断裂,用户数据分散导致正反馈机制缺失
48:48
Manus 在高危操作场景中易卡住且消耗 credits
50:14
Cursor 正从编程工具转变为通用平台,市场渗透率更高
52:28
垂类 AI Agent 如 Vantel 和 Sweetspot 在特定领域具有显著优势
53:32
Sweetspot 可帮助企业申请联邦补助金、解读合同
55:33
Gamma 具有模块化设计和炸裂视觉效果,AI 生成功能完善
57:51
当时的一些应用不算真正的 agent,更像 chatbot
59:21
2025 年初大家认为今年是 “Agent 之年”
1:01:35
MCP 协议目前更多是 API 的 AI 化封装,未达真正 AI 原生

Chapters

RFT 推动的 Agent 热潮
AI Agent 进展大事件以及核心三大原因
00:00
机器学习视角下的 Agent 进化
04:55
RFT(强化学习微调)技术促使 Agent 在 2025 年具有智能
06:36
大语言模型的 AlphaGo 时刻: 不仅具有思考能力,还根据环境反馈调整学习
08:10
过去半年新趋势: Agent 在环境中完成任务
11:04
OpenAI Operator 买菜的体验: 速度慢、准确率不高
14:27
内化工作流: 新一代 Agent 能做出临场反应
17:32
创造虚拟环境: Scrapybara 帮我买秋裤
20:55
Cursor 与 Windsurf 编程 Agent 为何出圈?
22:39
AI 创业门槛降低,可以做平台上那些小而美的 Agent
26:11
Manus
Manus 搜集信息量大但质量低,适合广度而非深度工作
32:53
Agent 爆火背后的秘密: Sonnet 3.5 代码质量的提升
38:05
比训练更重要?Evaluation 的三代进化
40:57
SFT 更便宜,RFT 效果更优,行业会如何选择?
44:02
Manus 的三大困境: 通用性的双刃剑;认知启动成本高;网络效应断裂
45:41
垂类 AI Agent 推荐
在关键场景请求人类对齐: Replit 和 Fellou 的优秀交互体验
48:45
最看好 Cursor,有成为通用 Agent 的潜力
50:13
Vantel: 每周帮保险经纪人省 10 小时的保险垂类 Agent
52:25
Sweetspot: 换了八九个邮箱也要用的,辅助申请资助类 Agent
53:29
Gamma: 秒杀 Canva 的 PPT 设计类 Agent
54:23
行业快与慢
做的 200 多个 Agent 中,商业化成功的案例
57:48
“越做发现问题越多”:离普通人每天使用 Agent 仍有距离
59:20
MCP 的生态建设需以年为单位
1:00:39

Transcript

泓君Jane: 嗨,大家好,欢迎收听硅谷 101, 我是红军。进入 2025 年以来,AI Agent 可以说进展很快,我来给大家简单复盘一下今年上半年的一些进展。1 月份,OpenAI 推出了能够自主使用浏览器的 AI Agent Operator,2 月份推出了研究复杂任务的 Deep Research。我相信很多人到现在可能已经是这个产品的深度用户了。那 3 月份,中国第一个号称,通用 AI agent 的 Manus 爆火出圈。5 月份,Manus 拿到了,硅谷老牌风险投资公司 Benchmark ...