scripod.com

E13 和 Macaron 创始人陈锴杰聊：RL + Memory 让 Agent 成为用户专属的“哆啦 A 梦”

Overview

Shownote

Highlights

Transcript

Chapters

Pins

E13 和 Macaron 创始人陈锴杰聊：RL + Memory 让 Agent 成为用户专属的 “哆啦 A 梦”

海外独角兽

2025/09/11

E13 和 Macaron 创始人陈锴杰聊：RL + Memory 让 Agent 成为用户专属的 “哆啦 A 梦”

E13 和 Macaron 创始人陈锴杰聊：RL + Memory 让 Agent 成为用户专属的 “哆啦 A 梦”

海外独角兽

海外独角兽

2025/09/11

Overview Shownote Highlights Transcript Chapters Pins

Shownote

最近，我们观察到 AI 市场开始出现了一些新变化：随着 ChatGPT 加入记忆功能，AI 的角色正发生有趣的转变 —— 它不仅是帮你写代码、做 PPT 的小工具，还有潜力成为一个真正懂你的生活伙伴。同时，Agent 开发进入了更成熟的阶段。过去大家主要依赖 prompt 技巧，如今通过强化学习和记忆系统，开发者可以训练出既有情商、又能生成小工具的智能体。这两个趋势的叠加，推动 AI Agent 可以更加个性化、专业化地完成用户任务。本期节目，我们邀请了 Macaron 创始人陈锴杰。他是 95 后连续创业...

Highlights

随着 AI 技术不断演进，Personal Agent 正从简单的任务执行者向理解用户生活习惯的智能伙伴转变。本期节目深入探讨了如何通过记忆与强化学习构建真正个性化的 AI 助手，以及这类系统在日常生活中的潜力。

04:07

对 Memory 的理解与他人不同，它应是个性化行为的基础。

05:29

记忆的目标是回答好问题，而非单纯记住内容。

14:57

即便不是最聪明的 AI，Macaron 仍会是用户的朋友

15:51

用户记忆与 coding agent 分离训练，分别优化情感交互与工具生成

21:04

每个有独特生活理念的人都能成为创作者

31:08

一万多个小应用中，Tracker and Planner 成为明显的强化方向。

37:59

Anthropic 在写代码上的优势来自大量场景化 RL 训练，GPT-5 难以超越。

39:42

AllSyncRL 通过全同步调度避免 GPU 算力浪费，显著提升训练效率

49:21

Macaron 会比朋友和家人更了解你

57:01

有了 Macaron 后，模型智能像自来水，生活中 Macaron 是水龙头

1:02:25

以前认为小赛道做到前三有市场地位，现在觉得意义不大。

1:08:15

专业场景的 Agent 有发掘价值和商业机会

Chapters

Personal Agent 如何改变个人生活

00:00

把 Memory 当成智能能力训练：Memory 不是目的，而是方法

05:24

如何进行冷启动 —— 让用户第一天就感到 “被理解”？

11:01

如何用 Multi-Agent 技术平衡 “高情商的朋友” 和 “高智商的助理”

15:51

Macaron 的愿景是做一个生活方式的分享平台

18:59

AI Sub Agent 的 “进化论” 和记忆传递方式

22:36

为什么强化学习（RL）是 Agent 智能提升下半场的核心？

35:55

All-sync RL 技术：把 RL 训练速度从周压缩到天，实现产品快速迭代

39:42

RL infra 很难像云服务一样标准化

43:15

三个真实用例带来的 Aha Moments

55:03

社交软件领域给 AI Agent 开发带来的思考

58:36

如何思考 OpenAI 等巨头在个人 Agent 领域带来的竞争？

1:06:21

Transcript

陈锴杰: 大家好，这里是海外独角兽，开源 AI 研究平台海外独角兽的同名声音栏目。我们主张用开源的研究和讨论精神，链接全球 AI 从业者。行业瞬息万变，我们在这里拉齐认知，抹平鸿沟。 Kage: 嘿，大家好，欢迎来到新一期海外独角兽，我是主持人 Kage。最近我们感受到两个 AI 市场明显的趋势，首先，ChatGPT 越火达到了 10 亿用户。并且加入了 memory 记忆能力，因此 AI Chatbot 的使用场景出现了明显的变化。AI 不仅能帮你写代码，做 PPT，还有潜力成为一个真正懂你的生活伙伴，来...

小宇宙

Open in 小宇宙