scripod.com

Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent|对谈 Sheet0 创始人王文锋

42章经

2025/04/19
42章经

42章经

2025/04/19
本期播客围绕 Agent 技术的核心问题展开讨论,深入探讨了其定义、发展、应用场景及未来趋势。通过与嘉宾王文锋的对话,听众可以了解到 Agent 在工具使用、强化学习、交互设计等方面的最新进展,以及如何评估一家 Agent 公司的技术水平。
Agent 技术近年来从玩具级产品发展为实际问题解决工具,得益于底层模型和工程突破。大模型整合信息生成判断并自动获取信息源。Tool Use 中,Function Call 和 MCP 降低工具使用门槛,Browser Use 模拟人类操作解决问题。AI Coding 与 Agent 紧密相关,提升开发效率。关于终局,市场认为通用性和垂直性各有优劣且长期共存。强化学习是 Agent 的核心,状态、行动和激励信号至关重要。交互设计上,聊天框结合场景推荐 UI 被看好。嘉宾分享了产品 Sheet0 的优势,展示动态随机生成代码替代人工操作。工作流和智能体功能结合可更好解决问题。AI Coding 是大模型的‘灵巧手’。Agent 发展面临结果可信度和功能可靠性两大信任命题。未来能力将提升,但成本下降需时。判断 Agent 公司好坏需关注技术背景和激励信号设1
00:20
00:20
最好的 Agent 定义是基于环境反馈使用工具的模型
01:18
01:18
两年前的 Agent 更像是玩具,现在已能带来实际价值。
03:42
03:42
核心是从网页等信息源抽取关注信息并准确校验
10:17
10:17
技术上用浏览器成本低,产品上需营造可信氛围
14:19
14:19
AI coding 被视为大模型工具,关键在于协作与复用
16:15
16:15
认为目前处于垂直 Agent 时代,强调资本市场的重要性
19:58
19:58
建议 Agent 开发者阅读 Richard Sutton 的书以深入理解强化学习
27:40
27:40
预制 System Prompt 在垂直领域中发挥关键作用,可将每步成功率提至 100%
32:55
32:55
模型能够自动进入 GitHub 主页分析线索,取代人工查找信息
35:39
35:39
workflow 是人驱动,稳定可靠但不够泛化;agent 是 AI 驱动,足够泛化但可能出错。
38:59
38:59
工程上已解决 AI 生成表格的数据幻觉问题
41:21
41:21
做 agent 的人要解决两个信任问题
43:00
43:00
产品的核心是暴露细节给人满足感和安全感
44:22
44:22
GPT 5 可能年底左右发布,之后 Agent 能力或大幅提升
48:46
48:46
大模型输出必须结构化以确保可用性