137: Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6
晚点聊 LateTalk
2025/10/16
137: Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6
137: Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6

晚点聊 LateTalk
2025/10/16
本期节目邀请了常驻硅谷的 AGI House 联合创始人 Henry Yin 与合伙人 Naomi Xia,深入探讨 Agent 工具链的最新发展趋势及其在美国的创业生态。对话围绕 OpenAI 开发者日发布的新动向展开,结合一线观察与投资实践,呈现 AI 智能体技术从框架到应用的演进路径。
OpenAI 通过 Agentic Kit、Apps in ChatGPT 等新工具,推动 ChatGPT 向操作系统级平台演进,强化企业服务能力和开发者支持。Agent 工具链正经历六阶段进化,涵盖工具调用、语音交互、记忆系统与评估机制。MCP 协议催生 Composio 等新兴服务商,而 LiveKit 等基础设施已在关键场景落地。记忆与评估环节仍面临数据共享与标准化挑战。AI 时代或将重构传统软件格局,Okta、Twilio 类公司有望被重新定义。随着中国 AI 创业者加速赴美,全球 Agent 生态竞争与合作将进一步深化。
07:20
07:20
trace grading 通过函数或模型打分评估用户与 agent 交互优劣
09:06
09:06
Agent Kit 和 SDK 为 ChatGPT 提供了真正的平台化能力,支持外部工具调用和工作流运行。
12:17
12:17
ChatGPT 有潜力成为操作系统
17:26
17:26
若放弃 2B 市场,将因数据缺失影响模型提升,进而削弱 2C 端体验。
20:40
20:40
OpenAI 与英伟达、甲骨文等深度绑定,处于大而不能倒的状态
23:38
23:38
Gemini 全平台计算用户量已超过 ChatGPT
30:15
30:15
OpenAI 全股收购 Statsig,将模型评测能力变为内置组件
37:00
37:00
Anthropic 的 MCP 协议成为 AI 工具生态主流标准
42:33
42:33
Rube 解决了在 Cursor 里使用 MCP server 数量受限的问题
44:06
44:06
设计过于复杂的 MCP server 可能降低工具执行成功率
44:18
44:18
Composio 的 MCP server 由 AI agent 自动编写并持续改进
50:26
50:26
关键工作流要求高可靠性,当前 Agent 操作准确率不足 60%-70% 则不可行
55:48
55:48
LiveKit 每周通过 911 急救指导平均挽救一条生命
58:51
58:51
Cascade 方式可控性更好,可在文本阶段添加保护机制
1:00:58
1:00:58
Minimax 新发布的语音模型在 Artificial Analysis 榜单排名靠前
1:01:57
1:01:57
流程记忆能让智能体避免重复错误并积累技能
1:09:04
1:09:04
拆分记忆比整句存储更利于后续查询可用性
1:10:29
1:10:29
记忆是上下文工程的一部分,上下文工程决定哪些信息应进入上下文
1:12:58
1:12:58
多数公司在部署 AI Agent 时缺乏严格的科学评估流程
1:14:07
1:14:07
编程和数学任务因标准明确,较容易进行 AI 评估并支持模型学习
1:16:52
1:16:52
AI Agent 带来的不仅是技术变革,更是服务业的重构,其基础设施市场可能达到现有规模的十倍以上。
1:27:48
1:27:48
智能体工具链和工具箱领域既有大公司投入,也存在丰富创业机会