76. 王小川返场谈 o1 与强化学习：摸到了一条从快思考走向慢思考的路

张小珺Jùn｜商业访谈录

2024/09/25

Overview Shownote Highlights Transcript Chapters Pins

本期节目邀请了王小川，深入探讨大模型与强化学习的融合趋势及其在医疗等领域的应用。王小川认为，大模型代表‘快思考’，强化学习代表‘慢思考’，两者结合是迈向通用人工智能的重要路径。同时，他分析了 OpenAI o1 作为范式升级的里程碑意义，以及其对技术发展的深远影响。

王小川在节目中强调了大模型和强化学习的互补性，指出前者擅长快速生成，而后者能弥补深度思考的不足。他以 OpenAI o1 为例，说明从‘快思考’到‘慢思考’的转变标志着 AI 技术的重大进步。此外，他还讨论了强化学习在医疗领域的潜力，如通过模拟医生思维链提升诊断能力。对于未来发展趋势，他认为强化学习将推动代码生成能力成为大模型的核心功能之一，并建议创业公司避开大厂竞争，专注于高价值领域如医疗。最后，他提到 AI 市场正从需求驱动转向供给驱动，强调开发实际应用场景的重要性。