scripod.com

138. 对罗福莉 3.5 小时访谈:AI 范式已然巨变!OpenClaw、Agent 范式很吃后训练、卡的分配、组织平权

本期访谈聚焦 2026 年 AI 范式从 Chat 时代向 Agent 时代的深刻跃迁,深入探讨技术演进、组织变革与研究哲学的多重共振。
罗福莉指出,大模型竞争已进入以高质量后训练(Post-train)为核心的 Agent 时代,1T 参数规模成为行业基本入场券。OpenClaw 等框架正推动 AI 从工具使用迈向数字分身共生,其分层记忆、自主编排与代码级可操纵性显著提升生产力。国内团队在预训练代差已基本消失,正全力攻坚 RL Infra 与 Agent 自迭代能力;算力分配正从 “Pre-train 主导” 转向 “Pre-train 与 Post-train 1:1” 的新平衡。组织上强调平权、角色流动与热爱驱动,拒绝僵化分工;技术路线上,小米 MiMo-V2 采用 Hybrid Retention 等另类架构,专注支持长上下文与多模态 Agent 行动。她强调,真正的智能差异在于框架能否弥补行动短板,而未来决胜点在于规模化 scaling 的战略判断、跨环节协同效率,以及在持续自我否定中坚守技术向善的价值观。
00:03
00:03
2026 年大模型战争进入后训练主导的 Agent 时代
17:31
17:31
OpenClaw 首次实现 Agent 自学习:框架能随模型进步动态演化,包含静态知识与动态适应机制
38:37
38:37
Claude Opus 4.6、OpenClaw 和 Signator 在依照上下文任务的稳定度上领先,Gemini 实际表现不佳
1:01:09
1:01:09
懂与不懂写代码的人共同参与提升模型能力,包括写 Skills、构建 Agent 框架、设计研究范式
1:10:12
1:10:12
模型已能根据 context 复原完整科研程序和路径
1:35:18
1:35:18
Post-train 投入的算力可能与 Pre-train 相当,团队若能用认知反哺架构设计,精细结构就具备可行性
1:47:39
1:47:39
训练 1T 模型的关键挑战是避免 Lost Spike,需建立严密监控系统洞察模型参数变化
1:56:56
1:56:56
做预训练的人做后训练有优势,能补充多样性,不应在组织结构上扼杀成员创造力
2:07:23
2:07:23
构造真正一体一照的上下文成本高或难寻场景
2:13:34
2:13:34
Omni 是首个支持音视频联合理解且 Agentic 能力与 Navage Model 相当的模型
2:36:07
2:36:07
智能体框架补齐了模型在复杂任务上的拼图,能以易交互方式让模型具备完成复杂任务的 context,且越用越聪明
2:46:12
2:46:12
3 月 11 日先上线两个神秘模型是因训练中发现某阶段模型好用,想让大家体验并获取评价
2:54:34
2:54:34
DeepSeek 的全新结构对训练和推理成本有冲击,让推理芯片有更准确判断
3:17:56
3:17:56
Agent 范式下,比拼核心是让模型通过 Agent 框架实现自迭代提升,并适配现有资源与生态位
3:24:07
3:24:07
博士比例 55% 仅是刻板数字,真正代表的是对研究的热爱程度