我是这样用 RL + LLM 做 Agent 的｜对谈 Pokee AI 创始人朱哲清 Bill

42章经

2025/01/18

Overview Shownote Highlights Transcript Chapters Pins

本期播客探讨了强化学习（RL）与大语言模型（LLM）结合在 AI Agent 领域的应用与发展前景。通过对话 Pokee AI 创始人 Bill，深入分析了 RL 的独特优势及其在电商等实际场景中的落地案例。同时，讨论了未来 AI Agent 市场的格局与发展方向。

强化学习因其在复杂规划和多步决策中的独特能力而备受关注。虽然大语言模型表现出色，但在涉及复杂推理时，RL 仍不可或缺。RL 与 LLM 结合可优化交互能力，解决实际问题如供应链管理和数学推理。RL 擅长处理不确定性较大的多步骤决策场景，而单一预测问题并非其强项。直接使用 LLM 难以构建规划型 Agent，因缺乏对未来影响的评估能力。有效的 Agent 架构以 RL 为核心，LLM 为翻译工具。Pokee AI 开发了一个电商领域的通用型 Agent，能智能调用大量 API 完成复杂任务。当前市场中，编程 Agent 较为成熟，但通用型 Agent 尚不存在。未来，Agent 将更多集中在高效利用现有工具上，而非复杂的自定义开发。一个具体应用示例是帮助商家自动议价、调整折扣和修改推荐策略，极大提升运营效率。强化学习的实际应用成本较低，小模型表现甚至优于大型模型。展望 2025 年，垂类 Agent 将成为市场热点，可能成为许多公司技术落地的关键时期。