scripod.com

当我们在讨论 Harness 的时候,我们在讨论什么 | 深度对谈: Minimax × Hermes Agent

十字路口Crossing
本期 podcast 聚焦 Agent 技术浪潮下的关键思辨与实践演进,邀请中美一线开发者围绕 Hermes Agent 的中国首秀、OpenClaw 的本土爆发、多智能体协作范式、Harness 架构本质、AI 自我进化边界等核心议题展开深度对谈。
对话揭示了 Agent 发展的阶段性逻辑:OpenClaw 因易用性与国产模型成熟率先点燃大众认知,Hermes 则以稳定记忆和技能沉淀解决持续交互痛点,推动 Agent 进入实用化阶段。Harness 作为协调多 Agent 的「挽具」,核心是让系统在真实反馈中自主沉淀 Skill,缓解人类成为瓶颈的困境。Multi-Agent 并非简单叠加,而是通过视角切换对抗单 Agent 的上下文衰减。技术演进正重塑人机关系 —— 用户不再训练模型,而是在构建 Harness 的过程中被「蒸馏」;yoyo Agent 等生存实验印证了 Agent 向开放世界自主进化的可能。但应用层终将被模型内化,创业机会更在垂直领域落地而非底层 Infra。中美差距不在方法论,而在任务定义能力与人才密度。最终共识是:AI 是增强人类的赋能工具,人的 taste、判断与创造力始终不可替代。
00:00
00:00
Hermes Agent 官方首次现身中国社交媒体平台并回应 EvoMap 抄袭指控
03:50
03:50
Hermes Agent 在记忆方面表现出色,弥补了 OpenClaw 记忆易刷新的不足
05:57
05:57
记忆组件可让智能体记住成功工作流并保存为技能
10:20
10:20
Hermes Agent 针对可用性和实用目的优化,开箱即用适合普及
18:07
18:07
Harness 让程序获得真实反馈并沉淀技能
21:08
21:08
让两个 agent 做 cross check,可换角度思考,提高思考质量
26:40
26:40
用户养小龙虾(agent)出现状况时,会反思‘自己没训好’而非归咎于 bug,标志人类对 AI 信任质变
32:31
32:31
人类的 taste 不可取代,agent 工作需人定义目标
42:45
42:45
Agent 需在与环境互动中不断推理、纠正执行路径以达成目标,如 OpenAI 设计的 Browse Camp Benchmark
47:24
47:24
代码是模型接触并适应真实世界边界的可执行接口
53:25
53:25
法律领域 Agent 需承担极高合规成本与零容错压力,无标准答案使其难以通用化
56:01
56:01
当下创业公司若未完成基础搭建就自行构建技术较难,像做 sandbox、memory infra、runtime infra 并非本质
1:00:35
1:00:35
Anthropic 未发布 Mythos 或因算力投入与封闭垄断考量
1:02:53
1:02:53
Claude Code 像‘中国式家长’,对模型约束多,反映大厂在 Agent 可控性上的优先考量
1:11:15
1:11:15
TOMODACHI LIVE 让玩家既是导演又是观众,构建可自主演化的模拟世界
1:16:12
1:16:12
打不过 AI 就加入 —— 应积极乐观地拥抱新版本