scripod.com

AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?

此话当真

2025/04/22
此话当真

此话当真

2025/04/22

Shownote

上个月底,OpenAI 宣布了一项惊艳全网的重大更新,将全新的图像生成模型加入了 GPT-4o。4o 不仅能够具备更强的编辑和合成能力,还能将文字的深入理解融入到图像生成中,通过简单的一行文字指令,就可以取代过去需要整合各种 AI 模型和工具的复杂创作工作流。毫无疑问,我们正在见证一个全新的视觉时代。 自 Sora 发布作为起点, AI 内容生成技术已经进入了惊人的发展,从最初的短秒级视频,再到如今更高画质、更强更可控的长视频生成以及精准编辑能力, AI 正在逐渐成为内容生产的核心引擎。 本期「此话当真」,...

Highlights

本期播客聚焦于 AI 图像与视频生成技术的最新进展及其在创意领域的应用。通过与多位行业专家的对话,探讨了从 Sora 到 GPT-4o 的技术演变,以及这些工具如何改变创作者的工作方式。嘉宾们还分享了对 AI 未来发展的见解,尤其是在视频生成领域中的潜力与挑战。
01:38
自 Sora 发布以来,AI 内容生成技术发展惊人
04:45
用 AI 制作上海版解谜游戏《锈沪》预告片获关注
05:46
AI 能很好地组合不同风格的部分,使拼贴风视频更流畅
10:18
GPT-4o 能够根据图片生成有趣且原创的四格漫画
11:38
GPT-4o 可上传图片抠图并将 PPT 图片元素单独拎出
14:42
部分创意工作已交由 AI 完成,下一阶段模型可能承担更多任务
21:31
自回归模型在生成速度和一致性方面超越扩散模型
23:49
扩散模型的优势是 DIT 和自回归模型难以解决的
30:23
视觉理解与生成同样重要,未来将更注重两者结合
32:15
硅谷关注视频模型底层创新,如 Sora 等项目
33:23
IP Adapter 升级让视频转换进入新阶段
34:42
主力生图工具可能因 GPT-4o 升级而改变
36:46
大一统模型比工作流模式更舒适、更丝滑
42:05
未来多模态大模型训练目标是实现 AGI
42:50
视频生成领域最终可能只有少数公司专注训练模型
46:39
Poro 平台可调用顶级生图和视频模型 API,但仍需充会员
51:10
让 AI 理解拍摄电影是可行的,只需模型学习镜头构造等知识和有标注数据
54:54
因熟悉 AI 工具且了解产业需求,能在新功能出现时快速对位
57:20
有人因信息噪音购买假 GPT 账号,建议找源头工具
1:01:16
AI 不应仅用于生成视频,应探索全新内容形态
1:12:55
理想的 AGI 能实时生成多样风格的 3D 世界
1:13:13
结构化内容和单点功能工具易受 AI 冲击
1:14:29
创作者在 AI 创作后使用 Adobe 工具频率上升,因其仍有缝缝补补的需求。
1:17:47
未来可能出现基于 AI 引擎的内容生产形式
1:18:22
应用强大 AI 工具后,每个人都有机会做出媲美皮克斯的动画

Chapters

AI 图像与视频生成技术的进展与应用
00:00
嘉宾介绍
海辛: 电影转 AI 内容创作者,用 AI 视频生成的内容做游戏
04:45
阿文: PPT 设计师,AI 也能做出很好的拼贴风动画
05:46
Barkley: 从 TikTok 加入 Luma 的产品经理
07:17
4o 图像生成发布之后
解构图像分层: 生成透明底的 png,解放生产力
11:38
Google Gemini & VS GPT-4o 的生图体验对比
13:26
自回顾模型逆转了之前扩散模型的优势
20:13
像素之间的距离与语义之间的距离有多远?
22:40
4o 把图片转化成语言,视觉理解和视觉生成同样重要
30:23
底层模型的研究最终会带来技术层、应用层、产品层的改变
32:15
国产视频模型带来实际生产力的提升,对 Sora 反而期望过高
33:23
过去一年的 AIGC 进展的惊艳时刻
从 Sora 到可灵,再从 Midjourney 到 Google Whisk 到 GPT-4o
34:42
当大一统模型足够强大,工作流会直接被替代
36:46
4o 也有做不到的事情: 高度自定义素材的无法延展、换脸只认识名人 etc
38:22
做视频生成届的 agent 或许为时过早
42:42
AIGC 不只是降本增效,而是新的艺术形态
各家模型优势不一,充会员都充哭了
45:05
复杂镜头组接的视听语言,需要有足够的数据和时间训练
48:37
现阶段无法被满足的制作需求,很快就能在某一天被实现
54:54
学习 AI 创作建议直接从源头找资料,屏蔽信息噪音
57:20
AI 诞生之后变得更幸福了吗?AI 不只是降本增效,而是新的艺术形态
59:57
AI 视频生成应用: 3D 动画、电影和广告行业的反应速度
1:03:02
视频领域的 AGI 时刻是什么?
最容易被 AI 冲击的是类似抠图的单点工具
1:13:13
Adobe 反而比以前用得更多了: AI 破破烂烂,行活缝缝补补
1:14:24
未来的皮克斯可能会诞生在一个 AI 公司里
1:16:30
创作不再是有钱有权的人才能享有的特权
1:18:22

Transcript

阿文: 首先想吐槽一下,我们充会员真的充哭了?因为各家模型的优势,都非常的不一样,都有自己的强项。我们测试了很多别的视频工具,都没有 Luma.ai 的走得远,所以我们后面在做这些,比较大的运动幅度的画面的话,都是用 Luma.ai。写实风的话用的最多的,可能是可灵和 PixWars,首尾帧的首选可能是 PixWars。 海辛: 但曾经的扩散模型,也有一些更多的优势。我们现在的图像模型,视频模型,两张图片的距离,像是它像素之间的距离,但扩散模型,两张图片的距离,像是它的语意之间的距离,概念之间的距离。 Ba...
小宇宙
Open in 小宇宙