E201|OpenAI 挑战通用型 AI Agent,聊聊 Agent 的底层架构、AGI 转折点与 RL 人才分布
硅谷101
2025/07/26
E201|OpenAI 挑战通用型 AI Agent,聊聊 Agent 的底层架构、AGI 转折点与 RL 人才分布
E201|OpenAI 挑战通用型 AI Agent,聊聊 Agent 的底层架构、AGI 转折点与 RL 人才分布

硅谷101
2025/07/26
本期《硅谷 101》聚焦 OpenAI 最新发布的通用型 ChatGPT Agent,深入剖析其技术架构、产品体验及背后的强化学习路径。节目邀请到 Pokee.ai 创始人、前 Meta AI 应用强化学习团队负责人朱哲清,从一线开发者视角解读 Agent 的运行机制、行业竞争格局以及通往 AGI 的技术挑战。
ChatGPT Agent 整合了 Deep Research 与 Operator,具备端到端完成复杂任务的能力,但在速度与个性化方面仍存在短板。其技术本质为 “浏览器 + 沙盒” 混合架构,与 Manus、Genspark 等形成差异化竞争。节目对比了四种主流 Agent 架构:浏览器型通用性强但速度慢;沙盒型高效但联网受限;工作流集成型精准但适用范围有限。强化学习被视为 AGI 从 “执行者” 迈向 “创新者” 的关键路径,但面临训练不稳定与验证泛化难题。未来 Agent 将重塑互联网入口,传统门户流量或将下滑,同时广告与内容推荐逻辑也将随之改变。强化学习人才集中于学术与头部企业,如何设计多目标奖励机制、解决灾难性遗忘仍是关键挑战。
00:01
00:01
OpenAI 定义的 AGI 前三层或已部分实现,当前正处第三到第四层跨越期
03:34
03:34
Browser-based Agent 在旅程规划等任务中表现有限
04:29
04:29
XGPT 在执行订机票、酒店等任务时表现更好
05:45
05:45
使用 Agent 订航班需人类接管支付环节
09:06
09:06
ChatGPT 像人类助理一样越用越顺手
11:25
11:25
Operator 和 Deep Research 在各自领域表现良好,整合后可实现端到端体验
12:38
12:38
OpenAI 在浏览器和操作能力上表现最佳
15:42
15:42
Pokee.ai 在多个 AI 代理方向展现出融合潜力
17:40
17:40
Genspark 在受限的 sandbox 环境中运行代码生成内容
19:05
19:05
Manus 通过 Sandbox 加浏览器环境构建通用操作平台
21:41
21:41
Deep Research 能执行更全面的任务并生成详细报告。
22:29
22:29
Pokee.ai 可能是目前所有 Agent 中最快的
25:14
25:14
AI 代理在普通消费者中留存率偏低
28:19
28:19
MCP 推动公司开放 SDK 和 API
29:39
29:39
Agent 将全程完成任务,无需打开网页
33:17
33:17
口播广告仍是播客主要收入来源
35:02
35:02
Agent 推荐内容时可向对应公司收费
38:58
38:58
工具链训练无法依赖现成数据,需采用强化学习方法
44:24
44:24
若提升 verifier 机制,可能迈向超级智能并产生人类未知知识
46:05
46:05
AI 在药物发现中可提出创新解决方案
48:07
48:07
验证能力决定了 AI 能否理解未知概念,如减法验证需要先验经验
50:41
50:41
AI 可能使用人类无法理解的语言超越人类知识,带来潜在风险
52:43
52:43
强化学习适用于复杂任务且无标准答案的场景
55:16
55:16
Scale AI 标注图片和视频数据技术含量高
56:51
56:51
图片打标因评判标准难统一而更难
58:25
58:25
图像、视频标注问题被认为是时间问题,将逐步解决
1:01:31
1:01:31
通过压缩工具数量提升模型泛化性和适用性
1:04:53
1:04:53
模型能力决定产品下限,产品细节决定上限
1:09:04
1:09:04
GPT-4、GPT-5 数据量尚未到极限,但模型性能终将面临瓶颈
1:14:08
1:14:08
若能实现 RL 预训练,将是巨大成功