88. 和吴翼技术解读 OpenAI Operator：推理从抽象世界走向物理世界的开端

张小珺Jùn｜商业访谈录

2025/01/24

Overview Shownote Highlights Transcript Chapters Pins

2025 年刚开年，全球 AI 界已将这一年定义为 “智能体元年”。随着 OpenAI 发布智能体产品 Operator，标志着全球智能体竞赛的开始。本期节目邀请了前 OpenAI 研究员吴翼，从技术角度解读 Operator 及其背后的意义。

Operator 作为 OpenAI 推出的首个智能体产品，代表了多模态、连续交互和闭环控制系统的结合。它不仅延续了 O1 和 O3 的功能，还在泛化性和强化学习路径上有所突破。通过强大的基座模型、高质量的数据集以及高效的强化学习系统，Operator 能够更好地整合语言、视觉和动作等不同模态的信息，并支持与其他 Agent 的协作。尽管目前主要局限于文本和视觉推理领域，但其设计预示着逻辑推理从抽象世界走向物理世界的开端。未来，随着 Agent 技术的发展，人类与 AI 的协作方式将发生深刻变化，交互模式可能更加个性化，减少对详细指令的依赖。同时，尽管大公司在这一领域占据主导地位，创业公司仍有机会在垂直领域积累数据并开发相关应用。总体而言，2025 年被视为 Agent 之年，多模态模型与强化学习的结合将继续推动 AI 技术的进步。