91. 逐篇讲解 DeepSeek 关键 9 篇论文及创新点 ——“勇敢者的游戏”
张小珺Jùn|商业访谈录
2025/02/11
91. 逐篇讲解 DeepSeek 关键 9 篇论文及创新点 ——“勇敢者的游戏”
91. 逐篇讲解 DeepSeek 关键 9 篇论文及创新点 ——“勇敢者的游戏”

张小珺Jùn|商业访谈录
2025/02/11
Shownote
Shownote
2025 年这个春节,DeepSeek 一举改写了全球 AGI 大叙事。在万般热闹之际,我们特别想沉下来做一些基础科普工作。 在《商业访谈录》89 集节目中,我邀请了加州大学伯克利分校人工智能实验室在读博士生潘家怡,为大家对照解读了春节前的 DeepSeek-R1-Zero、R1、Kimi 发布的 K1.5,以及 OpenAI 更早发布的 o1 技术报告。这些模型聚焦的都是大模型最新技术范式,RL 强化学习,简单来说就是 o1 路线。 今天这集,我邀请的是香港科技大学计算机系助理教授何俊贤。他的研究方向是大模型推理,从很早就开始关注...
Highlights
Highlights
本期节目聚焦于 DeepSeek 在大模型推理领域的技术创新与复现工作,通过解读其 9 篇关键论文,从技术底层视角剖析 DeepSeek 的研究路径。嘉宾何俊贤教授将带领听众深入理解 DeepSeek 的技术发展脉络及其对 AI 行业的贡献。
Chapters
Chapters
解读 DeepSeek 的论文与技术发展
00:00DeepSeek 基座模型
《DeepSeek LLM Scaling Open-Source Language Models with Longtermism》技术讲解
21:00《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》技术讲解
45:48《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》技术讲解
1:06:40《DeepSeek-V3 Technical Report》技术讲解
1:40:17DeepSeek 推理模型
《DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence》技术讲解
2:05:03《DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence》技术讲解
2:12:16《DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data》和《DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search》技术讲解
2:47:18《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》技术讲解
2:52:40Transcript
Transcript
何俊贤: 让我觉得非常的就是尊重他们的工作。其实他们的第一线 paper 放出来,就是他们的第一个成果,就是 DeepSeek 的第一个大模型的 paper,就是 DeepSeek LLM。对今天等会儿我也会讲到那篇 paper。我今天的对他们 paper 的讲解。主要会分为两个方面,一个方面是讲他们的基础模型的发展,然后另外的一个方面。我今天想讲到主要是他们在 reasoning 方面的东西,总结一下做一个概况。就是我觉得,从很早的时候开始,Deepseek 就有这样一种,文化或者追求,就不是纯粹的 fo...

Open in 小宇宙