scripod.com

20 个问题,解读 AI 视频元年|对谈 Luma AI 产品经理 Barkley:从 Sora 惊艳亮相到群雄逐鹿的一年

十字路口Crossing

Shownote

上周,我们的「20 问」栏目上线,非常感谢大家的支持,给了我们继续加油的动力!本周,我们继续通过 20 个问题来梳理一个领域的进展:AI 视频模型。 2024 年 2 月 15 日,Sora 惊艳登场,令业界为之瞩目。视频模型与视频生成应用迅速成为 AI 领域的焦点方向。2024 年呈现出群雄逐鹿的局面:硅谷有 Pika、Runway 和 Google 旗下的 DeepMind,国内则有海螺、可灵、Vidu、PixVerse,以及腾讯混元、字节豆包等玩家。 本期「十字路口」,我们邀请到硅谷一线的视频模型初...

Highlights

本期《十字路口》节目聚焦于 AI 视频模型领域的最新进展与未来趋势,邀请了 Luma.ai 的产品经理 Barkley 作为嘉宾。在 Sora 发布一周年之际,节目通过一系列深入问题,探讨了 AI 视频生成技术的演进、主要玩家的动向以及工程与管理能力在当前阶段的重要性。
02:50
Luma 公司在 2023 年底從 3D 生成轉向視頻生成
04:59
Luma AI 推出新一代 Ray 2 模型,提升视频生成能力
07:59
定制 prompt 测试模型的真实事件模拟与一致性效果
09:24
DeepMind 正推进 VO 模型并与多模态结合,OpenAI 持续迭代 Sora 并探索 AGI 方向
14:52
部分高端创作者已尝试使用可灵、海螺等国内 AI 工具
15:50
若追求‘世界模型’并通向 AGI,需要长期愿景支撑和持续投入
18:55
公司靠融资进行下一代研究,同时控制成本
20:44
视频模型因数据量大且噪声多,理解数据间关系比语言模型更难
23:40
Sam Altman 表示会持续投入视觉和多模态研究
25:58
世界模型需符合物理规律地理解和生成视觉信息
28:10
Luma 认为通过视频理解和 Scaling Law 数据方式,不一定需通过 3D 理解世界物理规律
31:13
数据处理流程虽无研究创新,但工程效率直接影响模型表现
31:58
Sora 证明 Scaling Law 在大规模数据 scale up 上可行,推动行业在此架构基础上进行改进和创新
33:25
大规模尝试多样化评测样例以找到最适合的标准
35:54
CEO 常问候选人从未解决过的问题以评估其学习与推理能力
36:55
用户通过视频模型与逝去亲人重逢,产生强烈情感连接
40:20
AI 视频生成有望实现观众实时参与修改剧情走向
41:19
多数大厂研究员反馈难以做出最好成绩
43:38
DeepSeek 在底层模型技术上取得突破,引起硅谷震惊
45:52
Runway CEO 認為 AI 將成基礎工具,重點在應用場景
52:23
AI 时代产品经理不再主导模型迭代方向,更多扮演连接用户与研究者的桥梁
52:39
所有产品经理都需要重新适应 AI 系统的新环境
56:46
优秀的产品经理应能快速发现问题本质并找到解决方法
58:09
通过体验产品理解背后模型的原理和边界
59:34
利用 TLDraw 构建 AI 论文与应用的四维图谱
1:04:29
Barkley 表示从中国模型和产品中学到很多并想象改进

Chapters

节目介绍与 20 问栏目开启
00:00
Barkley 个人经历:从 TikTok 特效组到在 Luma.ai 做产品经理
01:50
Sora 发布一周年,视频模型领域有哪些范式创新?
03:11
Luma 这几个月在做什么?
05:16
评估一个视频模型的依据是什么?
06:43
视频模型哪家强?目前就平衡动作幅度、一致性、美学等方面,谁做得更好一点?
08:27
Pika、Runway、DeepMind,海螺、可灵、Vidu、PixVerse 都在做什么?
09:21
硅谷怎么看国内的 AI 视频模型?
13:37
DeepSeek 的爆火,也带动更多人关注中国的视频模型
15:12
研究 or 应用,选了之后呢?
15:47
选择偏向研究的方向,商业化怎么平衡?
18:52
视频模型和文字模型,发展路径上都遵循 Scaling Law,但工程上训练模式可能有差异
20:44
通往 AGI 的必要之路是视觉吗?Barkley 在聚会上问过 Sam Altman 同样的问题
22:17
李飞飞提出的「世界模型」是什么?
24:46
「世界模型」的启发:不只是局限在生成视频,可能是 anything to anything 模型
26:48
要继续突破,工程和管理能力价值大于算法创新?
29:53
算法突破上的有哪些有意义的尝试?
31:58
做一件没有人做过的事情,没有参考样本时,必须靠大胆创新的环境推动创新发生
33:25
“我们 CEO 经常问来面试的候选人一个问题,一个从来没解决过的问题,你要怎么去做?”
35:54
最近看到的视频生成领域让人眼前一亮的使用案例是什么?
36:47
大胆预测,视频生成领域短期和长期会发生什么?
38:27
硅谷公司午餐时间,大家都在聊什么?
41:19
DeepSeek 效应
43:35
Luma.ai v.s. Runway,两个公司 CEO 在 X 上的交锋
45:46
从在 TikTok 做特效产品经理到在 Luma.ai 做模型,产品经理的角色发生了什么变化?
48:58
其他 AI 公司的产品经理在做什么?
52:39
企业招聘产品经理时的要求发生了什么变化?
55:02
身处快速变化的行业,做什么来保持学习?
58:09
身边有哪些可以借鉴的学习方法?
59:28
在硅谷的中国创业者,有哪些不一样的新机会?如何抓住?
1:02:03

Transcript

Ronghui: 欢迎收听十字路口,我们关注新一代 AI 技术浪潮,带来的行业新变化和创业新机会。十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变。我们寻找、访谈和凝聚 AI 时代的积极行动者,和他们一起探索和拥抱新变化、新的可能性。我是主播 Ronghui,联合创办了街旁,新世相和躺岛。我相信科技,尤其是 AI,会在未来十年彻底改变社会。 Barkley: 赋能人类。 Ronghui: 欢迎大家找我聊天,碰撞想法,链接下一个可能性...
小宇宙
Open in 小宇宙