scripod.com

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

Overview

Shownote

Highlights

Transcript

Chapters

Pins

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

此话当真

2025/04/22

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

AIGC 创意、产品与投资的三重对谈：未来的皮克斯会诞生在 AI 公司里吗？

此话当真

此话当真

2025/04/22

Overview Shownote Highlights Transcript Chapters Pins

本期播客聚焦于 AI 图像与视频生成技术的最新进展及其在创意领域的应用。通过与多位行业专家的对话，探讨了从 Sora 到 GPT-4o 的技术演变，以及这些工具如何改变创作者的工作方式。嘉宾们还分享了对 AI 未来发展的见解，尤其是在视频生成领域中的潜力与挑战。

随着 AI 技术的快速发展，图像和视频生成模型正逐渐成为内容创作的核心引擎。嘉宾们讨论了 GPT-4o 带来的图像分层生成能力，显著提升了编辑效率；同时对比了 Google Gemini 与 GPT-4o 在生图体验上的差异。自回归模型的崛起正在逆转扩散模型的优势，而多模态联合训练则推动了更深层次的理解与生成能力。国产视频模型如 Pixworth 和海螺已在实际生产力上取得突破，尽管 Sora 仍需优化提示词响应。大一统模型展现出替代传统工作流的潜力，但在高度定制化素材和换脸功能上仍有局限。视频生成领域尚未达到语言模型的成熟阶段，但基础模型研究正在加速推进。未来，AI 不仅将降低创作门槛，还将催生全新的艺术形式，使创作不再局限于资源丰富的专业人士。

01:38

01:38

自 Sora 发布以来，AI 内容生成技术发展惊人

04:45

04:45

用 AI 制作上海版解谜游戏《锈沪》预告片获关注

05:46

05:46

AI 能很好地组合不同风格的部分，使拼贴风视频更流畅

10:18

10:18

GPT-4o 能够根据图片生成有趣且原创的四格漫画

11:38

11:38

GPT-4o 可上传图片抠图并将 PPT 图片元素单独拎出

14:42

14:42

部分创意工作已交由 AI 完成，下一阶段模型可能承担更多任务

21:31

21:31

自回归模型在生成速度和一致性方面超越扩散模型

23:49

23:49

扩散模型的优势是 DIT 和自回归模型难以解决的

30:23

30:23

视觉理解与生成同样重要，未来将更注重两者结合

32:15

32:15

硅谷关注视频模型底层创新，如 Sora 等项目

33:23

33:23

IP Adapter 升级让视频转换进入新阶段

34:42

34:42

主力生图工具可能因 GPT-4o 升级而改变

36:46

36:46

大一统模型比工作流模式更舒适、更丝滑

42:05

42:05

未来多模态大模型训练目标是实现 AGI

42:50

42:50

视频生成领域最终可能只有少数公司专注训练模型

46:39

46:39

Poro 平台可调用顶级生图和视频模型 API，但仍需充会员

51:10

51:10

让 AI 理解拍摄电影是可行的，只需模型学习镜头构造等知识和有标注数据

54:54

54:54

因熟悉 AI 工具且了解产业需求，能在新功能出现时快速对位

57:20

57:20

有人因信息噪音购买假 GPT 账号，建议找源头工具

1:01:16

1:01:16

AI 不应仅用于生成视频，应探索全新内容形态

1:12:55

1:12:55

理想的 AGI 能实时生成多样风格的 3D 世界

1:13:13

1:13:13

结构化内容和单点功能工具易受 AI 冲击

1:14:29

1:14:29

创作者在 AI 创作后使用 Adobe 工具频率上升，因其仍有缝缝补补的需求。

1:17:47

1:17:47

未来可能出现基于 AI 引擎的内容生产形式

1:18:22

1:18:22

应用强大 AI 工具后，每个人都有机会做出媲美皮克斯的动画