scripod.com

E13 和 Macaron 创始人陈锴杰聊:RL + Memory 让 Agent 成为用户专属的 “哆啦 A 梦”

海外独角兽

2025/09/11
海外独角兽

海外独角兽

2025/09/11

Shownote

最近,我们观察到 AI 市场开始出现了一些新变化:随着 ChatGPT 加入记忆功能,AI 的角色正发生有趣的转变 —— 它不仅是帮你写代码、做 PPT 的小工具,还有潜力成为一个真正懂你的生活伙伴。同时,Agent 开发进入了更成熟的阶段。过去大家主要依赖 prompt 技巧,如今通过强化学习和记忆系统,开发者可以训练出既有情商、又能生成小工具的智能体。 这两个趋势的叠加,推动 AI Agent 可以更加个性化、专业化地完成用户任务。 本期节目,我们邀请了 Macaron 创始人陈锴杰。他是 95 后连续...

Highlights

随着 AI 技术不断演进,Personal Agent 正从简单的任务执行者向理解用户生活习惯的智能伙伴转变。本期节目深入探讨了如何通过记忆与强化学习构建真正个性化的 AI 助手,以及这类系统在日常生活中的潜力。
04:07
对 Memory 的理解与他人不同,它应是个性化行为的基础。
05:29
记忆的目标是回答好问题,而非单纯记住内容。
14:57
即便不是最聪明的 AI,Macaron 仍会是用户的朋友
15:51
用户记忆与 coding agent 分离训练,分别优化情感交互与工具生成
21:04
每个有独特生活理念的人都能成为创作者
31:08
一万多个小应用中,Tracker and Planner 成为明显的强化方向。
37:59
Anthropic 在写代码上的优势来自大量场景化 RL 训练,GPT-5 难以超越。
39:42
AllSyncRL 通过全同步调度避免 GPU 算力浪费,显著提升训练效率
49:21
Macaron 会比朋友和家人更了解你
57:01
有了 Macaron 后,模型智能像自来水,生活中 Macaron 是水龙头
1:02:25
以前认为小赛道做到前三有市场地位,现在觉得意义不大。
1:08:15
专业场景的 Agent 有发掘价值和商业机会

Chapters

Personal Agent 如何改变个人生活
00:00
把 Memory 当成智能能力训练:Memory 不是目的,而是方法
05:24
如何进行冷启动 —— 让用户第一天就感到 “被理解”?
11:01
如何用 Multi-Agent 技术平衡 “高情商的朋友” 和 “高智商的助理”
15:51
Macaron 的愿景是做一个生活方式的分享平台
18:59
AI Sub Agent 的 “进化论” 和记忆传递方式
22:36
为什么强化学习(RL)是 Agent 智能提升下半场的核心?
35:55
All-sync RL 技术:把 RL 训练速度从周压缩到天,实现产品快速迭代
39:42
RL infra 很难像云服务一样标准化
43:15
三个真实用例带来的 Aha Moments
55:03
社交软件领域给 AI Agent 开发带来的思考
58:36
如何思考 OpenAI 等巨头在个人 Agent 领域带来的竞争?
1:06:21

Transcript

陈锴杰: 大家好,这里是海外独角兽,开源 AI 研究平台海外独角兽的同名声音栏目。我们主张用开源的研究和讨论精神,链接全球 AI 从业者。行业瞬息万变,我们在这里拉齐认知,抹平鸿沟。 Kage: 嘿,大家好,欢迎来到新一期海外独角兽,我是主持人 Kage。最近我们感受到两个 AI 市场明显的趋势,首先,ChatGPT 越火达到了 10 亿用户。并且加入了 memory 记忆能力,因此 AI Chatbot 的使用场景出现了明显的变化。AI 不仅能帮你写代码,做 PPT,还有潜力成为一个真正懂你的生活伙伴,来...
小宇宙
Open in 小宇宙