EP 67. 解析 DeepSeek R1 技术创新与生态影响:强化学习,Long CoT,数据,Agent 与开源生态
OnBoard!
2025/03/03
EP 67. 解析 DeepSeek R1 技术创新与生态影响:强化学习,Long CoT,数据,Agent 与开源生态
EP 67. 解析 DeepSeek R1 技术创新与生态影响:强化学习,Long CoT,数据,Agent 与开源生态

OnBoard!
2025/03/03
Shownote
Shownote
2025 年第一期 OnBoard! 让大家久等了!没错,这个话题我们怎么能绕的过去:Deepseek! Deepseek 春节前夕发布的开源推理模型 Deepseek r1,无疑是整个世界最令人关注的新闻,不论你过去是否关注 AI,相信都已经被关于 Deepseek 的各种新闻和解读轰炸了好久。但是 OnBoard! 的硬核讨论,迟来却不过时。 Hello World, who is OnBoard!? Deepseek R1 在数学、代码和各种推理能力比肩市面上最强的 OpenAI o1 正式版模型,...
Highlights
Highlights
本期 OnBoard 节目聚焦于 DeepSeek R1 开源推理模型的发布及其对中国 AI 领域的深远影响。几位来自中美的一线研究者和从业者,深入探讨了 DeepSeek 的技术创新、推理模型的核心挑战以及其对开源大模型生态的影响。通过多角度的分析,节目揭示了技术本质,并展望了未来的发展方向。
Chapters
Chapters
探讨 DeepSeek R1 模型及其影响
00:00解析 DeepSeek R1 技术核心
几位嘉宾自我介绍,fun fact: DeepSeek R1 让你惊艳的使用场景是什么? 好的文笔是背诵还是理解?
03:34如果用 RL 生产数据越来越重要,还需要人类标注数据吗?
17:53DeepSeek R1-Zero 为什么值得关注?跟 R1 是什么关系?TinyZero 复现 R1 的过程中有什么启发?
23:52为什么看似简单的 Long CoT 的做法,一直到现在才被广泛用起来?Long CoT 的研究沿革和进展是怎样的?
35:11推理模型的 Aha Moment 是什么?跟模型的 “涌现能力” 有什么关系?
48:29澄清一下!正确理解 “成本 30 美金”!
51:13Long CoT 的实现有什么难点?DeepSeek 做了哪些值得关注的创新?
52:36做 Coding agent 的经验: 模型 coding 能力能泛化到更广泛的 Agent 能力吗?
58:33SFT 在 R1 训练中的作用?RL 生成数据成本会比人工标注低吗?
1:02:32Scale up RL 的难点是什么?为什么说这是 DeepSeek infra 能力中容易被忽视的点
1:11:46开源社区的 infra 限制,会对复现后续研究 RL 和推理模型相关工作有什么影响?
1:14:08为什么说 Rewards and Simulators are all you need: 还有哪些挑战?
1:19:57MoE vs Dense model 的选择: 业界已经是共识了吗?
1:34:34DeepSeek 蒸馏 OpenAI 的数据了吗?
1:47:29OpenAI o3 思维链中出现了中文应该如何理解?
1:52:14大模型开源生态会发生什么变化
开源大模型需要将数据开源吗?
1:55:52开源和闭源模型的差距会一直存在吗?这个差距对于使用者和模型公司意味着什么?
2:03:01未来开源推理模型都会向 DeepSeek R1 的路线上收敛吗?对开源生态会有怎样的影响?
2:07:44从 DeepSeek V3 到 R1, 有了基座模型训练推理模型,只需要几周的时间吗?
2:11:36开发者选择开源还是闭源模型,有怎样的考量?今年开源大模型生态有哪些变化值得期待?
2:12:59如何理解: Agentic workflow 只有短期价值,长期会被模型能力取代?Agent 公司的核心能力是什么?
2:22:13未来展望与宏观思考
2025 年,几位嘉宾的工作重点是什么?
2:29:30AI 领域有什么过热的以及还没有被充分讨论的话题?
2:35:22过去半年有什么观点的变化?
2:40:36AI 超越大部分人类智能的时候,你的生存意义是什么?
2:44:08Transcript
Transcript
Monica Xie: 真实的一线经验,走心的投资思考,我是 Monica。
Tiezhen Wang: 我是 GN, 我们一起聊聊软件如何改变世界。
Monica Xie: 大家好,欢迎来到 Onboard, 我是 Monica,2025 年春节后的第一期 Onboard 让大家久等了。没错,今天这个话题我们怎么能绕得过去?当然就是 DeepSeek,DeepSeek 春节前夕发布的开源推理模型 DeepSeek R1 无疑是整个世界最令人关注的新闻。不论你过去是否关注 AI,相信你都已经被关于 Deep...

Open in 小宇宙