scripod.com

E191|小而美的机会来了,聊聊这轮 AI Agent 进化新范式

硅谷101|中国版

Shownote

进入 2025 年,AI Agent 仿佛按下了加速键:从 OpenAI 推出自助浏览器 Operator,到 Manus 爆火出圈并获 7500 万美元融资。究竟是什么引爆了这轮 AI Agent 的热潮? 代码能力的提升为 AI Agent 的奠定了基础,RFT(强化学习微调)带来了大模型的 “AlphaGo” 时刻,嘉宾甚至都感叹 “时代变了,开发产品成本低得有点恐怖”。但通用 AI Agent 是否真的是未来?数据壁垒、用户认知成本以及网络效应的缺失,都可能成为其发展的桎梏。 或许,更具前景的是那些深耕垂直领域的 “小而美” 的 Agent....

Highlights

2025 年,AI Agent 领域快速发展,从代码能力的提升到强化学习微调技术的应用,推动了 Agent 的智能化进程。然而,通用 AI Agent 面临诸多挑战,如数据壁垒和用户认知成本高等问题。本期节目将深入探讨 AI Agent 的核心技术、热门产品体验及未来发展方向。
01:26
MCP 协议提出,行业基础设施开始搭建
05:01
Agent 从强化学习到大语言模型驱动的转变
06:36
强化学习微调技术使 Agent 在特定领域自主学习
10:09
DeepSeek RE 实现了基于环境奖励的自主学习和问题解决能力
11:10
过去很多公司因未在电脑操作环境中训练模型而失败
15:20
Agent 通过强化学习微调,形成连续的思考、执行和反馈环节
18:54
参数化智能使 AI Agent 能根据反馈调整策略
20:58
Scrapybara 为用户提供即时安全的虚拟环境,适用于多种场景
23:59
早期 Cursor 仅限于写代码,而 Windsurf 能执行文件操作和搜索技术文档
28:58
AI 形成网络后可能带来个体释放及新创业机会
36:22
大模型能力提升是 AI Agent 爆火的关键
38:07
Sonnet 3.5 是首个解决 coding 问题的模型,对 agent 能力提升巨大
41:59
AI agent 需从一开始就具备评估能力,并发展通用评估模板库
45:35
Manus 存在一些明显困境
46:51
通用 AI Agent 难以形成平台级飞轮效应,用户上传的数据分散影响正反馈机制
48:46
Fellow 由谢阳开发,执行任务前可视化堆积,并具备系统级权限
50:15
Cursor 正从编程工具转变为多场景连接平台
52:28
Vantel 为商业保险经纪人提供高效的自动化解决方案
53:32
Sweetspot AI 能帮助企业申请联邦补助金并进行合同解读
54:30
Gamma 能秒杀 Canva,只需给出框架即可生成 PPT
57:51
早期产品主要依赖固定流程,无法实现真正的智能化操作
59:21
Agent 要成为大众使用 AI 的方式仍有很长的路要走
1:00:40
MCP 协议的进化需要以年为单位,当前最大问题是平台不愿开放数据

Chapters

RFT 推动的 Agent 热潮
AI Agent 进展大事件以及核心三大原因
00:00
机器学习视角下的 Agent 进化
04:55
RFT(强化学习微调)技术促使 Agent 在 2025 年具有智能
06:36
大语言模型的 AlphaGo 时刻: 不仅具有思考能力,还根据环境反馈调整学习
08:10
过去半年新趋势: Agent 在环境中完成任务
11:04
OpenAI Operator 买菜的体验: 速度慢、准确率不高
14:27
内化工作流: 新一代 Agent 能做出临场反应
17:32
创造虚拟环境: Scrapybara 帮我买秋裤
20:55
Cursor 与 Windsurf 编程 Agent 为何出圈?
22:39
AI 创业门槛降低,可以做平台上那些小而美的 Agent
26:11
Manus
Manus 搜集信息量大但质量低,适合广度而非深度工作
32:53
Agent 爆火背后的秘密: Sonnet 3.5 代码质量的提升
38:05
比训练更重要?Evaluation 的三代进化
40:57
SFT 更便宜,RFT 效果更优,行业会如何选择?
44:02
Manus 的三大困境: 通用性的双刃剑;认知启动成本高;网络效应断裂
45:41
垂类 AI Agent 推荐
在关键场景请求人类对齐: Replit 和 Fellou 的优秀交互体验
48:45
最看好 Cursor,有成为通用 Agent 的潜力
50:13
Vantel: 每周帮保险经纪人省 10 小时的保险垂类 Agent
52:25
Sweetspot: 换了八九个邮箱也要用的,辅助申请资助类 Agent
53:29
Gamma: 秒杀 Canva 的 PPT 设计类 Agent
54:23
行业快与慢
做的 200 多个 Agent 中,商业化成功的案例
57:48
“越做发现问题越多”:离普通人每天使用 Agent 仍有距离
59:20
MCP 的生态建设需以年为单位
1:00:39

Transcript

泓君Jane: 嗨,大家好,欢迎收听硅谷 101, 我是泓君。进入 2025 年以来,AI Agent 可以说进展很快,我来给大家简单复盘一下今年上半年的一些进展。1 月份,OpenAI 推出了能够自主使用浏览器的 AI Agent Operator,2 月份推出了研究复杂任务的 Deep Research。我相信很多人到现在可能已经是这个产品的深度用户了。那 3 月份,中国第一个号称,通用 AI agent 的 Manus 爆火出圈。5 月份,Manus 拿到了,硅谷老牌风险投资公司 Benchmark ...