AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?
此话当真
2025/04/22
AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?
AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?

此话当真
2025/04/22
Shownote
Shownote
上个月底,OpenAI 宣布了一项惊艳全网的重大更新,将全新的图像生成模型加入了 GPT-4o。4o 不仅能够具备更强的编辑和合成能力,还能将文字的深入理解融入到图像生成中,通过简单的一行文字指令,就可以取代过去需要整合各种 AI 模型和工具的复杂创作工作流。毫无疑问,我们正在见证一个全新的视觉时代。
自 Sora 发布作为起点, AI 内容生成技术已经进入了惊人的发展,从最初的短秒级视频,再到如今更高画质、更强更可控的长视频生成以及精准编辑能力, AI 正在逐渐成为内容生产的核心引擎。
本期「此话当真」,...
Highlights
Highlights
本期播客聚焦于 AI 图像与视频生成技术的最新进展及其在创意领域的应用。通过与多位行业专家的对话,探讨了从 Sora 到 GPT-4o 的技术演变,以及这些工具如何改变创作者的工作方式。嘉宾们还分享了对 AI 未来发展的见解,尤其是在视频生成领域中的潜力与挑战。
Chapters
Chapters
AI 图像与视频生成技术的进展与应用
00:00嘉宾介绍
海辛: 电影转 AI 内容创作者,用 AI 视频生成的内容做游戏
04:45阿文: PPT 设计师,AI 也能做出很好的拼贴风动画
05:46Barkley: 从 TikTok 加入 Luma 的产品经理
07:174o 图像生成发布之后
解构图像分层: 生成透明底的 png,解放生产力
11:38Google Gemini & VS GPT-4o 的生图体验对比
13:26自回顾模型逆转了之前扩散模型的优势
20:13像素之间的距离与语义之间的距离有多远?
22:404o 把图片转化成语言,视觉理解和视觉生成同样重要
30:23底层模型的研究最终会带来技术层、应用层、产品层的改变
32:15国产视频模型带来实际生产力的提升,对 Sora 反而期望过高
33:23过去一年的 AIGC 进展的惊艳时刻
从 Sora 到可灵,再从 Midjourney 到 Google Whisk 到 GPT-4o
34:42当大一统模型足够强大,工作流会直接被替代
36:464o 也有做不到的事情: 高度自定义素材的无法延展、换脸只认识名人 etc
38:22做视频生成届的 agent 或许为时过早
42:42AIGC 不只是降本增效,而是新的艺术形态
各家模型优势不一,充会员都充哭了
45:05复杂镜头组接的视听语言,需要有足够的数据和时间训练
48:37现阶段无法被满足的制作需求,很快就能在某一天被实现
54:54学习 AI 创作建议直接从源头找资料,屏蔽信息噪音
57:20AI 诞生之后变得更幸福了吗?AI 不只是降本增效,而是新的艺术形态
59:57AI 视频生成应用: 3D 动画、电影和广告行业的反应速度
1:03:02视频领域的 AGI 时刻是什么?
最容易被 AI 冲击的是类似抠图的单点工具
1:13:13Adobe 反而比以前用得更多了: AI 破破烂烂,行活缝缝补补
1:14:24未来的皮克斯可能会诞生在一个 AI 公司里
1:16:30创作不再是有钱有权的人才能享有的特权
1:18:22Transcript
Transcript
阿文: 首先想吐槽一下,我们充会员真的充哭了?因为各家模型的优势,都非常的不一样,都有自己的强项。我们测试了很多别的视频工具,都没有 Luma.ai 的走得远,所以我们后面在做这些,比较大的运动幅度的画面的话,都是用 Luma.ai。写实风的话用的最多的,可能是可灵和 PixWars,首尾帧的首选可能是 PixWars。
海辛: 但曾经的扩散模型,也有一些更多的优势。我们现在的图像模型,视频模型,两张图片的距离,像是它像素之间的距离,但扩散模型,两张图片的距离,像是它的语意之间的距离,概念之间的距离。
Ba...

Open in 小宇宙