scripod.com
中美大厂研究员深度剖析:DeepSeek大模型蒸馏与RLHF技术技术解析

Highlights

Transcript

Chapters

Pins

中美大厂研究员深度剖析:DeepSeek 大模型蒸馏与 RLHF 技术技术解析

AI Odyssey

2025/03/24
AI Odyssey

AI Odyssey

2025/03/24
OverviewShownote
Unprocessed episode, you can be the first!

Shownote

主播的话: 欢迎收听本期 AI Odyssey 节目。DeepSeek 凭借其出色的性能和创新的技术路线在 AI 领域引起广泛关注。作为国内新兴的开源大模型,它在多项基准测试中表现优异,引发了业内对其背后技术实现的好奇。正因如此,我们特意邀请了三位 AI 领域的一线专家 —— 投资人 CW,美团首席工程师奚辰光,以及专注于大模型优化的 GenAI 研究员 Tianyi,共同解析 DeepSeek 模型的技术创新点,特别是在训练成本优化、数据蒸馏和 RLHF 等方面的突破。通过这次对话,我们希望为听众揭开高性能开源模型背后的技术思路,也期待...

Highlights

Chapters

Transcript

小宇宙
Open in 小宇宙