scripod.com

20 个问题,解读 AI 视频元年|对谈 Luma AI 产品经理 Barkley:从 Sora 惊艳亮相到群雄逐鹿的一年

十字路口Crossing
本期《十字路口》节目聚焦于 AI 视频模型领域的最新进展与未来趋势,邀请了 Luma.ai 的产品经理 Barkley 作为嘉宾。在 Sora 发布一周年之际,节目通过一系列深入问题,探讨了 AI 视频生成技术的演进、主要玩家的动向以及工程与管理能力在当前阶段的重要性。
Barkley 分享了自己从 TikTok 特效团队到 Luma.ai 的职业转变,并介绍了 Luma 近期在视频生成和理解方面的研究进展。他指出,尽管尚未出现新的模型架构范式,但各公司在数据处理、模型训练和应用落地方面持续创新。节目中还比较了 DeepMind、Runway、Pika 等海外公司与国内如海螺、可灵等企业在技术和市场策略上的差异。嘉宾强调,视觉模型可能是通往 AGI 的重要路径,而李飞飞提出的世界模型概念也为多模态发展提供了启发。此外,他还谈到产品经理在 AI 时代角色的变化,以及硅谷与中国在 AI 人才和创业机会上的互动与趋势。
02:50
02:50
Luma 公司在 2023 年底從 3D 生成轉向視頻生成
04:59
04:59
Luma AI 推出新一代 Ray 2 模型,提升视频生成能力
07:59
07:59
定制 prompt 测试模型的真实事件模拟与一致性效果
09:24
09:24
DeepMind 正推进 VO 模型并与多模态结合,OpenAI 持续迭代 Sora 并探索 AGI 方向
14:52
14:52
部分高端创作者已尝试使用可灵、海螺等国内 AI 工具
15:50
15:50
若追求‘世界模型’并通向 AGI,需要长期愿景支撑和持续投入
18:55
18:55
公司靠融资进行下一代研究,同时控制成本
20:44
20:44
视频模型因数据量大且噪声多,理解数据间关系比语言模型更难
23:40
23:40
Sam Altman 表示会持续投入视觉和多模态研究
25:58
25:58
世界模型需符合物理规律地理解和生成视觉信息
28:10
28:10
Luma 认为通过视频理解和 Scaling Law 数据方式,不一定需通过 3D 理解世界物理规律
31:13
31:13
数据处理流程虽无研究创新,但工程效率直接影响模型表现
31:58
31:58
Sora 证明 Scaling Law 在大规模数据 scale up 上可行,推动行业在此架构基础上进行改进和创新
33:25
33:25
大规模尝试多样化评测样例以找到最适合的标准
35:54
35:54
CEO 常问候选人从未解决过的问题以评估其学习与推理能力
36:55
36:55
用户通过视频模型与逝去亲人重逢,产生强烈情感连接
40:20
40:20
AI 视频生成有望实现观众实时参与修改剧情走向
41:19
41:19
多数大厂研究员反馈难以做出最好成绩
43:38
43:38
DeepSeek 在底层模型技术上取得突破,引起硅谷震惊
45:52
45:52
Runway CEO 認為 AI 將成基礎工具,重點在應用場景
52:23
52:23
AI 时代产品经理不再主导模型迭代方向,更多扮演连接用户与研究者的桥梁
52:39
52:39
所有产品经理都需要重新适应 AI 系统的新环境
56:46
56:46
优秀的产品经理应能快速发现问题本质并找到解决方法
58:09
58:09
通过体验产品理解背后模型的原理和边界
59:34
59:34
利用 TLDraw 构建 AI 论文与应用的四维图谱
1:04:29
1:04:29
Barkley 表示从中国模型和产品中学到很多并想象改进