scripod.com

E13 和 Macaron 创始人陈锴杰聊:RL + Memory 让 Agent 成为用户专属的 “哆啦 A 梦”

海外独角兽

2025/09/11
海外独角兽

海外独角兽

2025/09/11
随着 AI 技术不断演进,Personal Agent 正从简单的任务执行者向理解用户生活习惯的智能伙伴转变。本期节目深入探讨了如何通过记忆与强化学习构建真正个性化的 AI 助手,以及这类系统在日常生活中的潜力。
Macaron 创始人陈锴杰分享了将 Memory 视为智能训练方法而非存储工具的理念,强调通过强化学习(RL)实现 AI 对用户的动态理解。团队利用 Multi-Agent 架构分离情感交互与功能执行,提升用户体验。All-sync RL 技术大幅缩短训练周期,使产品能快速迭代。冷启动阶段通过兴趣引导和个性化匹配,让用户第一时间感受到 “被理解”。Sub Agent 可封装个人生活方式并共享,推动平台向生活分享社区演进。尽管面临 OpenAI 等巨头的竞争,Macaron 聚焦垂直场景,致力于打造兼具情商与智商的专属 Agent,探索 AI 在非生产力领域的深层价值。
04:07
04:07
对 Memory 的理解与他人不同,它应是个性化行为的基础。
05:29
05:29
记忆的目标是回答好问题,而非单纯记住内容。
14:57
14:57
即便不是最聪明的 AI,Macaron 仍会是用户的朋友
15:51
15:51
用户记忆与 coding agent 分离训练,分别优化情感交互与工具生成
21:04
21:04
每个有独特生活理念的人都能成为创作者
31:08
31:08
一万多个小应用中,Tracker and Planner 成为明显的强化方向。
37:59
37:59
Anthropic 在写代码上的优势来自大量场景化 RL 训练,GPT-5 难以超越。
39:42
39:42
AllSyncRL 通过全同步调度避免 GPU 算力浪费,显著提升训练效率
49:21
49:21
Macaron 会比朋友和家人更了解你
57:01
57:01
有了 Macaron 后,模型智能像自来水,生活中 Macaron 是水龙头
1:02:25
1:02:25
以前认为小赛道做到前三有市场地位,现在觉得意义不大。
1:08:15
1:08:15
专业场景的 Agent 有发掘价值和商业机会