走向强化学习:Agent 还是应用公司的机会吗?对话 Pokee.ai 创始人朱哲清
硅基觉醒FM
2025/04/14
走向强化学习:Agent 还是应用公司的机会吗?对话 Pokee.ai 创始人朱哲清
走向强化学习:Agent 还是应用公司的机会吗?对话 Pokee.ai 创始人朱哲清

硅基觉醒FM
2025/04/14
Shownote
Shownote
hi,这里是硅基觉醒。 这是一档围绕 AI 前沿技术与商业变革的节目,汇聚 AI 创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们! 随着对 Agent 的讨论进入深水区,强化学习(RL)成为绕不过去的一个话题。尤其以 OpenAI 的 Deep Research 开启的基于强化学习的 Agent,正成为新的 Agent 范式。但是 Agent 的强化学习怎么做,技术门槛有多高,普通创业公司能否参与,围绕 Agent 的强化学习有太多待解...
Highlights
Highlights
本期硅基觉醒聚焦于 AI Agent 与强化学习的前沿技术及其商业应用。通过与 Pokee.ai 创始人朱哲清 Bill、史业民及小苏的深度对话,探讨了下一代 Foundation AI Agent 的技术实现路径和行业变革潜力。
Chapters
Chapters
硅基觉醒:Agent 与强化学习的未来
00:00Part 1 Pokee.ai: 瞄准下一代的 AI Agent
Pokee.ai 的愿景: 下一代的 Foundation AI Agent
02:05Agent 需要能对真实世界产生影响
04:36Manus 属于下一代 Agent 吗?
06:36Pokee.ai 从 0 开始训练 RL 模型,可调用上千个工具
08:54与 OpenAI Deep Research 的差异化
09:27Deep Research 的实现方法
11:06通用 Agent vs 垂直 Agent
12:37垂直 Agent 可能长在通用 Agent 上面
18:27通用 Agent 什么时候能落地?
24:44Part 2 技术深入: Agent 强化学习的实现细节
Agent 的强化学习是如何实现的?
27:38实现强化学习的成本有多高?
32:01技术层面,Agent 的强化学习与 LLM 训练过程中的 RL 有啥区别?
37:10实现 Agent 的强化学习最难的技术部分是什么?
44:57为什么过去强化学习不具备泛化性,而现在能解决通用问题?
48:06Part 3 商业变革: 模型即产品论调卷土重来?
重提模型即产品
52:37OpenAI 不可能做出一个供应链领域的 Agent
54:28Agent 领域大模型公司和应用公司的边界划分
56:30未来 SaaS 行业会被 Agent 取代吗?
1:04:03如何招募 Agent 的强化学习人才
1:06:23Transcript
Transcript
Harry: 嗨,这里是《硅基觉醒》。这是一档围绕 AI 前沿技术和商业变革的节目,汇聚了 AI 创业者、投资人以及大厂一线的实践和观察。我们希望一起见证超级智能的到来,迎接《硅基觉醒》的年代。欢迎大家在小宇宙平台和微信公众号关注我们。如果你觉得本期内容不错,欢迎分享到你的朋友圈,或者分享给感兴趣的好友。将会极大帮助我们播客的成长。本期我们将继续探讨 Agent 这一话题。随着对 Agent 讨论的深入,大家逐步发现,做 Agent 绕不过去的一个技术话题,便是强化学习。OpenAI 的 Deep Rese...

Open in 小宇宙