153: 阿里 Qwen 人事变动:误读、近况、伏笔和未来
晚点聊 LateTalk
Mar 04
153: 阿里 Qwen 人事变动:误读、近况、伏笔和未来
153: 阿里 Qwen 人事变动:误读、近况、伏笔和未来

晚点聊 LateTalk
Mar 04
这期短播客聚焦阿里通义千问(Qwen)团队在 3 月 3 日至 4 日突发的人事与组织震荡,从一线研发视角出发,厘清传言、还原事实,并回溯这场变动背后长达数年的技术积累、协作张力与基础设施困局。
节目澄清林俊旸并非主动离职,其离任与团队架构重组紧密关联:原高度协同的预训练 - 后训练模式被打破,转向按模态和环节划分的水平化结构,由新任后训练负责人周浩推动。管理层称此举是扩大投入而非收缩,但核心成员担忧技术路线模糊与协作效率下降。历史脉络显示,自 2020 年布局起,Qwen 虽凭借高训练成功率快速成长,却长期受制于阿里云 Infra 支持不足 —— 从周畅 2024 年夏离职,到强化学习微调遇阻、新一代模型迭代卡点,均与此相关。开源影响力获全球认可,但内部对其商业化路径与 APP 体验(如落后豆包)存在分歧。当前团队正全力推进模型迭代,而规模化机制与技术理想主义之间的张力,仍是阿里 AI 战略的关键考验。
00:03
00:03
林俊旸并非主动离职
02:07
02:07
林俊旸于 3 月 3 日下午在 Qwen 群宣布离职,次日凌晨发推特动态
05:55
05:55
Qwen 团队认为阿里云对其 infra 支持不足,这有历史原因
09:44
09:44
2024 年 9 月 Qwen 发布后,千问团队尝试后训练强化学习但初期效果不佳,归因于 Infra 问题
13:23
13:23
猎头深夜联系林俊旸,投资人主动索要 Qwen 核心成员联系方式
17:03
17:03
林俊旸曾想推动 1T 模型开源