scripod.com

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

Overview

Shownote

Highlights

Transcript

Chapters

Pins

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

此话当真

2025/04/22

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

此话当真

此话当真

2025/04/22

Overview Shownote Highlights Transcript Chapters Pins

Shownote

上个月底，OpenAI 宣布了一项惊艳全网的重大更新，将全新的图像生成模型加入了 GPT-4o。4o 不仅能够具备更强的编辑和合成能力，还能将文字的深入理解融入到图像生成中，通过简单的一行文字指令，就可以取代过去需要整合各种 AI 模型和工具的复杂创作工作流。毫无疑问，我们正在见证一个全新的视觉时代。自 Sora 发布作为起点， AI 内容生成技术已经进入了惊人的发展，从最初的短秒级视频，再到如今更高画质、更强更可控的长视频生成以及精准编辑能力， AI 正在逐渐成为内容生产的核心引擎。本期「此话当真」，...

Highlights

本期播客聚焦于 AI 图像与视频生成技术的最新进展及其在创意领域的应用。通过与多位行业专家的对话，探讨了从 Sora 到 GPT-4o 的技术演变，以及这些工具如何改变创作者的工作方式。嘉宾们还分享了对 AI 未来发展的见解，尤其是在视频生成领域中的潜力与挑战。

01:38

自 Sora 发布以来，AI 内容生成技术发展惊人

04:45

用 AI 制作上海版解谜游戏《锈沪》预告片获关注

05:46

AI 能很好地组合不同风格的部分，使拼贴风视频更流畅

10:18

GPT-4o 能够根据图片生成有趣且原创的四格漫画

11:38

GPT-4o 可上传图片抠图并将 PPT 图片元素单独拎出

14:42

部分创意工作已交由 AI 完成，下一阶段模型可能承担更多任务

21:31

自回归模型在生成速度和一致性方面超越扩散模型

23:49

扩散模型的优势是 DIT 和自回归模型难以解决的

30:23

视觉理解与生成同样重要，未来将更注重两者结合

32:15

硅谷关注视频模型底层创新，如 Sora 等项目

33:23

IP Adapter 升级让视频转换进入新阶段

34:42

主力生图工具可能因 GPT-4o 升级而改变

36:46

大一统模型比工作流模式更舒适、更丝滑

42:05

未来多模态大模型训练目标是实现 AGI

42:50

视频生成领域最终可能只有少数公司专注训练模型

46:39

Poro 平台可调用顶级生图和视频模型 API，但仍需充会员

51:10

让 AI 理解拍摄电影是可行的，只需模型学习镜头构造等知识和有标注数据

54:54

因熟悉 AI 工具且了解产业需求，能在新功能出现时快速对位

57:20

有人因信息噪音购买假 GPT 账号，建议找源头工具

1:01:16

AI 不应仅用于生成视频，应探索全新内容形态

1:12:55

理想的 AGI 能实时生成多样风格的 3D 世界

1:13:13

结构化内容和单点功能工具易受 AI 冲击

1:14:29

创作者在 AI 创作后使用 Adobe 工具频率上升，因其仍有缝缝补补的需求。

1:17:47

未来可能出现基于 AI 引擎的内容生产形式

1:18:22

应用强大 AI 工具后，每个人都有机会做出媲美皮克斯的动画

Chapters

AI 图像与视频生成技术的进展与应用

00:00

嘉宾介绍

海辛: 电影转 AI 内容创作者，用 AI 视频生成的内容做游戏

04:45

阿文: PPT 设计师，AI 也能做出很好的拼贴风动画

05:46

Barkley: 从 TikTok 加入 Luma 的产品经理

07:17

4o 图像生成发布之后

解构图像分层: 生成透明底的 png，解放生产力

11:38

Google Gemini & VS GPT-4o 的生图体验对比

13:26

自回顾模型逆转了之前扩散模型的优势

20:13

像素之间的距离与语义之间的距离有多远？

22:40

4o 把图片转化成语言，视觉理解和视觉生成同样重要

30:23

底层模型的研究最终会带来技术层、应用层、产品层的改变

32:15

国产视频模型带来实际生产力的提升，对 Sora 反而期望过高

33:23

过去一年的 AIGC 进展的惊艳时刻

从 Sora 到可灵，再从 Midjourney 到 Google Whisk 到 GPT-4o

34:42

当大一统模型足够强大，工作流会直接被替代

36:46

4o 也有做不到的事情: 高度自定义素材的无法延展、换脸只认识名人 etc

38:22

做视频生成届的 agent 或许为时过早

42:42

AIGC 不只是降本增效，而是新的艺术形态

各家模型优势不一，充会员都充哭了

45:05

复杂镜头组接的视听语言，需要有足够的数据和时间训练

48:37

现阶段无法被满足的制作需求，很快就能在某一天被实现

54:54

学习 AI 创作建议直接从源头找资料，屏蔽信息噪音

57:20

AI 诞生之后变得更幸福了吗？AI 不只是降本增效，而是新的艺术形态

59:57

AI 视频生成应用: 3D 动画、电影和广告行业的反应速度

1:03:02

视频领域的 AGI 时刻是什么？

最容易被 AI 冲击的是类似抠图的单点工具

1:13:13

Adobe 反而比以前用得更多了: AI 破破烂烂，行活缝缝补补

1:14:24

未来的皮克斯可能会诞生在一个 AI 公司里

1:16:30

创作不再是有钱有权的人才能享有的特权

1:18:22

Transcript

阿文: 首先想吐槽一下，我们充会员真的充哭了？因为各家模型的优势，都非常的不一样，都有自己的强项。我们测试了很多别的视频工具，都没有 Luma.ai 的走得远，所以我们后面在做这些，比较大的运动幅度的画面的话，都是用 Luma.ai。写实风的话用的最多的，可能是可灵和 PixWars，首尾帧的首选可能是 PixWars。海辛: 但曾经的扩散模型，也有一些更多的优势。我们现在的图像模型，视频模型，两张图片的距离，像是它像素之间的距离，但扩散模型，两张图片的距离，像是它的语意之间的距离，概念之间的距离。 Ba...

小宇宙

Open in 小宇宙