AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?
此话当真
2025/04/22
AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?
AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?

此话当真
2025/04/22
本期播客聚焦于 AI 图像与视频生成技术的最新进展及其在创意领域的应用。通过与多位行业专家的对话,探讨了从 Sora 到 GPT-4o 的技术演变,以及这些工具如何改变创作者的工作方式。嘉宾们还分享了对 AI 未来发展的见解,尤其是在视频生成领域中的潜力与挑战。
随着 AI 技术的快速发展,图像和视频生成模型正逐渐成为内容创作的核心引擎。嘉宾们讨论了 GPT-4o 带来的图像分层生成能力,显著提升了编辑效率;同时对比了 Google Gemini 与 GPT-4o 在生图体验上的差异。自回归模型的崛起正在逆转扩散模型的优势,而多模态联合训练则推动了更深层次的理解与生成能力。国产视频模型如 Pixworth 和海螺已在实际生产力上取得突破,尽管 Sora 仍需优化提示词响应。大一统模型展现出替代传统工作流的潜力,但在高度定制化素材和换脸功能上仍有局限。视频生成领域尚未达到语言模型的成熟阶段,但基础模型研究正在加速推进。未来,AI 不仅将降低创作门槛,还将催生全新的艺术形式,使创作不再局限于资源丰富的专业人士。
01:38
01:38
自 Sora 发布以来,AI 内容生成技术发展惊人
04:45
04:45
用 AI 制作上海版解谜游戏《锈沪》预告片获关注
05:46
05:46
AI 能很好地组合不同风格的部分,使拼贴风视频更流畅
10:18
10:18
GPT-4o 能够根据图片生成有趣且原创的四格漫画
11:38
11:38
GPT-4o 可上传图片抠图并将 PPT 图片元素单独拎出
14:42
14:42
部分创意工作已交由 AI 完成,下一阶段模型可能承担更多任务
21:31
21:31
自回归模型在生成速度和一致性方面超越扩散模型
23:49
23:49
扩散模型的优势是 DIT 和自回归模型难以解决的
30:23
30:23
视觉理解与生成同样重要,未来将更注重两者结合
32:15
32:15
硅谷关注视频模型底层创新,如 Sora 等项目
33:23
33:23
IP Adapter 升级让视频转换进入新阶段
34:42
34:42
主力生图工具可能因 GPT-4o 升级而改变
36:46
36:46
大一统模型比工作流模式更舒适、更丝滑
42:05
42:05
未来多模态大模型训练目标是实现 AGI
42:50
42:50
视频生成领域最终可能只有少数公司专注训练模型
46:39
46:39
Poro 平台可调用顶级生图和视频模型 API,但仍需充会员
51:10
51:10
让 AI 理解拍摄电影是可行的,只需模型学习镜头构造等知识和有标注数据
54:54
54:54
因熟悉 AI 工具且了解产业需求,能在新功能出现时快速对位
57:20
57:20
有人因信息噪音购买假 GPT 账号,建议找源头工具
1:01:16
1:01:16
AI 不应仅用于生成视频,应探索全新内容形态
1:12:55
1:12:55
理想的 AGI 能实时生成多样风格的 3D 世界
1:13:13
1:13:13
结构化内容和单点功能工具易受 AI 冲击
1:14:29
1:14:29
创作者在 AI 创作后使用 Adobe 工具频率上升,因其仍有缝缝补补的需求。
1:17:47
1:17:47
未来可能出现基于 AI 引擎的内容生产形式
1:18:22
1:18:22
应用强大 AI 工具后,每个人都有机会做出媲美皮克斯的动画