scripod.com

137: Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6

晚点聊 LateTalk

Shownote

「《晚点聊》 AGI House 第一次聊,之后会陆续更新硅谷的 AI 新趋势。」 本期,我们邀请了两位常驻硅谷的朋友,AGI house 的 Henry Yin 和 Naomi Xia,来一起聊 Agent 工具链(Agentic Tooling)的发展趋势,和这个领域在美国的创业实践。 AGI House (https://agihouse.org/) 是一个 2023 年开始运营的 AI 创业和投资社区,连接了 Andrej Karpathy( OpenAI 联创、Eureka Labs 创始人 )、 ...

Highlights

本期节目邀请了常驻硅谷的 AGI House 联合创始人 Henry Yin 与合伙人 Naomi Xia,深入探讨 Agent 工具链的最新发展趋势及其在美国的创业生态。对话围绕 OpenAI 开发者日发布的新动向展开,结合一线观察与投资实践,呈现 AI 智能体技术从框架到应用的演进路径。
07:20
trace grading 通过函数或模型打分评估用户与 agent 交互优劣
09:06
Agent Kit 和 SDK 为 ChatGPT 提供了真正的平台化能力,支持外部工具调用和工作流运行。
12:17
ChatGPT 有潜力成为操作系统
17:26
若放弃 2B 市场,将因数据缺失影响模型提升,进而削弱 2C 端体验。
20:40
OpenAI 与英伟达、甲骨文等深度绑定,处于大而不能倒的状态
23:38
Gemini 全平台计算用户量已超过 ChatGPT
30:15
OpenAI 全股收购 Statsig,将模型评测能力变为内置组件
37:00
Anthropic 的 MCP 协议成为 AI 工具生态主流标准
42:33
Rube 解决了在 Cursor 里使用 MCP server 数量受限的问题
44:06
设计过于复杂的 MCP server 可能降低工具执行成功率
44:18
Composio 的 MCP server 由 AI agent 自动编写并持续改进
50:26
关键工作流要求高可靠性,当前 Agent 操作准确率不足 60%-70% 则不可行
55:48
LiveKit 每周通过 911 急救指导平均挽救一条生命
58:51
Cascade 方式可控性更好,可在文本阶段添加保护机制
1:00:58
Minimax 新发布的语音模型在 Artificial Analysis 榜单排名靠前
1:01:57
流程记忆能让智能体避免重复错误并积累技能
1:09:04
拆分记忆比整句存储更利于后续查询可用性
1:10:29
记忆是上下文工程的一部分,上下文工程决定哪些信息应进入上下文
1:12:58
多数公司在部署 AI Agent 时缺乏严格的科学评估流程
1:14:07
编程和数学任务因标准明确,较容易进行 AI 评估并支持模型学习
1:16:52
AI Agent 带来的不仅是技术变革,更是服务业的重构,其基础设施市场可能达到现有规模的十倍以上。
1:27:48
智能体工具链和工具箱领域既有大公司投入,也存在丰富创业机会

Chapters

OpenAI 新工具与 Agent 生态展望
00:00
OpenAI 开发者日
Agentic Kit 是 OpenAI 开放了自己练的 “一身武功”
03:30
Apps in ChatGPT 和 2023 年 GPTs 的区别
09:06
Canva in ChatGPT 新体验
10:53
OpenAI 不会放弃 to B
14:47
一种批评,AgenticKit 与 AGI 思路背道而驰
18:16
开发者的机会与压力:在别人的地基上建房子
21:15
Agentic Tooling 的 6 次进化
Agentic Tooling 是什么?近期 3 笔交易 / 收购看到的状态
26:33
Agentic Tooling 的 6 次进化,对应模型能力的 6 次提升
31:24
当下环节梳理
MCP Server 集成商是做什么?
39:59
当前调用 MCP Server 的数量限制,创造 Rube 等产品的机会
43:09
Composio,一家从印度来美国的公司,怎么从 Agent 厂商转型 MCP server 服务商
44:18
这真是创业机会吗?为何 Anthropic 自己不做?
49:09
911 也在用的 AI voice 平台
53:09
从 LiveKit 平台看到的调用偏好:Speech to Speech(语音端到端)和 Cascade 模型现在一半一半
57:25
OpenAI 等核心 Lab 的 Voice 动作
59:28
四种记忆:情景、流程、事实/知识、人格/性格
1:01:57
创业案例:Letta,记忆也可以由第三方来做吗?
1:04:26
记忆和上下文工程
1:10:29
一个重要,但很多人不好好做的环节
1:11:50
评估难,难在构造数据集
1:14:07
2000-5000 亿的工具生态市场
Okta、Twilio、DataDog 都可以在 AI 时代 “再做一遍”
1:15:27
2025 年,“闯美” 中国 AI 创业公司变多,它们带来了不一样的野心
1:21:23

Transcript

Henry Yin: ChatGPT 的最终目标是 ChatGPT 操作系统化。比如说 OpenAI 现在内部成立了一个新的,叫做 Future of Work 的一个 team,开始就是加速 AI 的各种商业场景下面的落地。我觉得一个批评的声音就是,这次 Agent Builder 其实就是和,比如说 AGI 的这个路线可能是有分歧的。 程曼祺: 欢迎收听晚点聊,我是曼琪。今天我邀请了两位常驻硅谷的朋友。AGI House 的合伙人 Henry Yin 和 Naomi Xia 来一起聊 Agent 的工具...