走向强化学习：Agent 还是应用公司的机会吗？对话 Pokee.ai 创始人朱哲清

硅基觉醒FM

2025/04/14

Overview Shownote Highlights Transcript Chapters Pins

本期硅基觉醒聚焦于 AI Agent 与强化学习的前沿技术及其商业应用。通过与 Pokee.ai 创始人朱哲清 Bill、史业民及小苏的深度对话，探讨了下一代 Foundation AI Agent 的技术实现路径和行业变革潜力。

强化学习在构建有效 Agent 中扮演关键角色，尤其是在多步操作任务完成和工具调用能力方面。讨论指出，通用 Agent 适合开发者和 2B 业务，而垂直 Agent 则满足特定领域需求。OpenAI Deep Research 与 Pokee.ai 在模型设计上存在差异，前者强调顺序生成结合搜索 API，后者独立训练 IRL 模型。强化学习的成本和技术门槛较高，但通过优化算法和数据收集方式可以降低样本需求。尽管过去强化学习泛化性不足，但现在通过目标驱动奖励函数设计和结合大模型可解决这一问题。‘模型即产品’论调重提，表明即使大公司在通用领域占优，垂直领域仍有机会。未来 SaaS 行业可能与 Agent 更紧密协作，而招募强化学习人才需注重基础扎实和迁移能力强的人才。