scripod.com

E191|小而美的机会来了,聊聊这轮 AI Agent 进化新范式

硅谷101|中国版
2025 年,AI Agent 领域快速发展,从代码能力的提升到强化学习微调技术的应用,推动了 Agent 的智能化进程。然而,通用 AI Agent 面临诸多挑战,如数据壁垒和用户认知成本高等问题。本期节目将深入探讨 AI Agent 的核心技术、热门产品体验及未来发展方向。
AI Agent 在 2025 年取得了显著进展,主要得益于 RFT(强化学习微调)技术的应用,使 Agent 具备更强的智能和自主学习能力。大语言模型结合环境反馈,进一步提升了 Agent 的任务执行能力。然而,通用 AI Agent 仍面临诸多挑战,包括数据壁垒、用户认知成本高以及网络效应缺失等问题。Manus 等工具虽然信息量大但质量较低,适合广度而非深度工作。此外,Evaluation 技术和 SFT、RFT 的选择对 Agent 发展至关重要。嘉宾认为,更具前景的是深耕垂直领域的 “小而美” Agent,如 Vantel、Sweetspot 和 Gamma 等。尽管行业快速发展,但 Agent 要成为大众日常使用的工具仍需克服许多障碍,MCP 协议的生态建设也需要以年为单位推进。
01:26
01:26
MCP 协议提出,行业基础设施开始搭建
05:01
05:01
Agent 从强化学习到大语言模型驱动的转变
06:36
06:36
强化学习微调技术使 Agent 在特定领域自主学习
10:09
10:09
DeepSeek RE 实现了基于环境奖励的自主学习和问题解决能力
11:10
11:10
过去很多公司因未在电脑操作环境中训练模型而失败
15:20
15:20
Agent 通过强化学习微调,形成连续的思考、执行和反馈环节
18:54
18:54
参数化智能使 AI Agent 能根据反馈调整策略
20:58
20:58
Scrapybara 为用户提供即时安全的虚拟环境,适用于多种场景
23:59
23:59
早期 Cursor 仅限于写代码,而 Windsurf 能执行文件操作和搜索技术文档
28:58
28:58
AI 形成网络后可能带来个体释放及新创业机会
36:22
36:22
大模型能力提升是 AI Agent 爆火的关键
38:07
38:07
Sonnet 3.5 是首个解决 coding 问题的模型,对 agent 能力提升巨大
41:59
41:59
AI agent 需从一开始就具备评估能力,并发展通用评估模板库
45:35
45:35
Manus 存在一些明显困境
46:51
46:51
通用 AI Agent 难以形成平台级飞轮效应,用户上传的数据分散影响正反馈机制
48:46
48:46
Fellow 由谢阳开发,执行任务前可视化堆积,并具备系统级权限
50:15
50:15
Cursor 正从编程工具转变为多场景连接平台
52:28
52:28
Vantel 为商业保险经纪人提供高效的自动化解决方案
53:32
53:32
Sweetspot AI 能帮助企业申请联邦补助金并进行合同解读
54:30
54:30
Gamma 能秒杀 Canva,只需给出框架即可生成 PPT
57:51
57:51
早期产品主要依赖固定流程,无法实现真正的智能化操作
59:21
59:21
Agent 要成为大众使用 AI 的方式仍有很长的路要走
1:00:40
1:00:40
MCP 协议的进化需要以年为单位,当前最大问题是平台不愿开放数据