scripod.com

E197|七大模型多模态之争,AI 如何改变动漫产业?

硅谷101

2025/06/20
硅谷101

硅谷101

2025/06/20

Shownote

当前,动漫产业处于发展的十字路口:一方面,产能瓶颈与市场需求的矛盾已成为行业痛点 —— 顶级工作室排期需等待两三年,大量制作环节仍依赖手绘,单集 40 万美元的成本背后是庞大的外包体系。另一方面,传统 “工匠精神” 正与飞速变革的 AI 技术磨合 —— 谷歌 Veo、OpenAI Sora 等视频生成模型每周迭代,从中间帧补全到风格转换的技术探索层出不穷,然而技术落地仍存在多重壁垒,人工修正与算力成本反超传统流程。 本期节目,我们跟随 Azuki 内容负责人天宇的视角,从他的日本考察之旅说起,深入聊聊以下问题: 当前在日本动画产业供需错位的格局下,AI 技术正如何应用于动漫制作? AI 生成视频能否突破稳定性与逻辑连贯性的技术瓶颈? 在创意生产与行业伦理层面,AI 将对未来的动画产业产生哪些深远影响? 【主播】 泓君 Jane,硅谷 101 创始人,播客主理人 【嘉宾】 天宇(二月茶),Azuki 内容负责人,ex-Google Brain(Twitter:@febtea) 【你将听到】 动画产业的矛盾:市场需求爆发 VS 成本与产能制约 2:22 动漫番剧的制作周期困局:排期等三年,顶级工作室档期爆满 3:38 动漫市场年增长率基本保持 10% 以上 4:55 低数字化与匠人精神:动漫制作 30%-40% 仍为纸上手绘 6:46 成本差异:日本单集 40 万美元 vs 好莱坞千万级 8:02 国漫正以前所未有的速度发展,但人才密度和优质运营管理模式不足 9:55 动漫差异:审美是关键 11:21 AZUKI 设计:前《守望先锋》爆款总监操刀 ,但美国产能容不下东亚二次元? 动漫工作室与 AI 的三类结合方式 14:41【类别一:传统派】借力 AI 补全中间帧,却困于细节差错 19:58 补中间帧: AI 提效的首要场景,但 5%-10% 的细节误差严重破坏观感 21:25 “精细” 是动画的生命:关键帧关乎创意性与可信度 26:18【类别二:颠覆派】部分新兴公司的选择:围绕 AI 设计全流程 27:04 KAKA Creation 的 30 分钟 AI 动画:水平及格但艺术性欠缺 32:04 【类别三:折中派】ChatGPT 模拟导演,人机协同破审核效率困局 39:26 回溯美术史,技术变革催生新的形式创新 动漫智能变革:有突破,但还不够好 43:42 7 + 大模型 “你追我赶”,周更竞争 48:27 20 秒以上的 AI 视频:逻辑连贯性不足,市场需求欠缺 50:51 三字总结视频大模型:不够好 52:09 规模化生产拦路虎:token 不足,算力成本高昂 52:48 人物眼神与手部稳定性显著提升,AI 穿帮问题基本解决 AI 动漫的未来:潜力与伦理风险并存 55:15 语音生成的伦理争议:日本声优协会公开反对 AI 模仿声线 56:46 配音与音乐领域,AI 已完全达到人类水平 58:07 好听的音乐总是相似的,AI 容易复制 01:00:25 人才断层,AI 切断新人进阶的 “梯子效应” 01:05:42 “你的品位可能决定了模型的品位” 01:08:38 “我们这一代的选择,可能影响人类技术与艺术的关系” 【相关播客】 E164|当电影遇上 AI:与好莱坞特效美术聊聊他们和新工具的博弈 (https://www.xiaoyuzhoufm.com/episode/66c681061b12cc3a6e3893a8) 【监制】 泓君 【后期】 AMEI 【运营】 陈思扬、孙泽平、王梓沁 【BGM】 Fool's Gold STEMS INSTRUMENTS - Spectacles Wallet and Watch Moonbug - Harry Edvino (Version a14336e6) - fullmixhighquality 【在这里找到我们】 公众号:硅谷 101 收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓 FM|荔枝 FM|网易云音乐|QQ 音乐 其他平台:YouTube|Bilibili 搜索「硅谷 101 播客」 联系我们:podcast@sv101.net Special Guest: 天宇(二月茶).

Highlights

本期节目围绕动漫产业的发展现状与 AI 技术的应用展开讨论。随着市场需求的快速增长,动漫制作面临产能不足和成本高昂的问题,而 AI 技术正在逐步融入这一领域,带来新的变革与挑战。
04:44
手游、潮玩、游戏市场加总后成长速度可能超预期
04:56
动漫制作仍依赖纸张,行业供给受人才和体制限制
06:46
动漫经费比想象中稳定,最贵可达一千万美元
08:02
中国动漫虽有投资热情,但产业成熟度仍需提高
09:55
即便美国诞生的 IP,视觉语言 DNA 也可能是日本动漫的
14:07
动作丰富的场景大幅提升动画制作难度
19:44
B 站研发团队前几周发布了关键帧生成相关论文
20:58
AI 生成的关键帧存在 5%-10% 差错影响动画制作
22:38
AI 生成的关键帧虽单张不错,但累积误差显著,仍需人工审查
26:18
第二类公司完全放弃现有动漫行业工业流程,以 AI 为核心打造新动画制作流程
28:36
AI 制作动漫目前存在科研成本高问题,表现力与美学设计有差距
34:29
动漫行业的导演和制片人对 AI 持开放态度,认为在关键节点能提供 40%-50% 的帮助就很有用
40:47
AI 应探索以前无法实现的可能性,为文化艺术带来新机遇
44:59
谷歌 Gemini 实现文字编辑图片功能,ChatGPT 随后推出类似功能
49:40
画面跳针严重、逻辑奇怪,像梦境一般,与稳定性有关
50:51
AI 生成视频的最大问题是可控性和效果不足
52:10
每月第一周 token 就不够用,询问生成人物时是否有恐怖谷效应
54:02
AI 工具迭代导致工业化生产中算力成本上升
55:15
多数尖端模型语音生成质量已与真人无异
56:46
声音技术已可替代人,但存在经济和工作伦理问题
1:00:18
用周杰伦的声音写歌可能带来伦理挑战
1:01:23
动画行业可能因 AI 出现大规模人才短缺现象
1:07:10
人类对创意的追求是永恒的,希望 AI 让世界更加多元

Chapters

日本之行与动漫产业探讨
00:00
动画产业的矛盾:市场需求爆发 VS 成本与产能制约
动漫番剧的制作周期困局:每季耗时四五年,顶级工作室档期爆满
02:22
动漫市场年增长率基本保持 10% 以上
03:38
低数字化与匠人精神:动漫制作 30%-40% 仍为手绘
04:55
成本差异:日本单集 40 万美元 vs 好莱坞千万级
06:46
国漫正以前所未有的速度发展,但人才密度和优质运营管理模式不足
08:02
动漫差异:审美是关键
09:55
AZUKI 设计:前《守望先锋》爆款总监操刀 ,但美国产能容不下东亚二次元?
11:21
动漫工作室与 AI 的三类结合方式
【类别一:传统派】借力 AI 补全中间帧,却困于细节差错
14:41
补中间帧: AI 提效的首要场景,但 5%-10% 的细节误差严重破坏观感
19:58
“精细” 是动画的生命:关键帧关乎创意性与可信度
21:25
【类别二:颠覆派】部分新兴公司的选择:围绕 AI 设计全流程
26:18
KAKA Creation 的 30 分钟 AI 动画:水平及格但艺术性欠缺
27:04
【类别三:折中派】ChatGPT 模拟导演,人机协同破审核效率困局
32:04
回溯美术史,技术变革催生新的形式创新
39:26
动漫智能变革:有突破,但还不够好
7 + 视频大模型 “你追我赶”,周更竞争
43:42
20 秒以上的 AI 视频:逻辑连贯性不足,市场需求欠缺
48:27
三字总结视频大模型:不够好
50:51
规模化生产拦路虎:token 不足,算力成本高昂
52:09
人物眼神与手部稳定性显著提升,AI 穿帮问题基本解决
52:48
AI 动漫的未来:潜力与伦理风险并存
语音生成的伦理争议:日本声优协会公开反对 AI 模仿声线
55:15
配音与音乐领域,AI 已完全达到人类水平
56:46
好听的音乐总是相似的,AI 容易复制
58:07
人才断层,AI 切断新人进阶的 “梯子效应”
1:00:25
“你的品位可能决定了模型的品位”
1:05:42
“我们这一代的选择,可能影响人类技术与艺术的关系”
1:08:38

Transcript

泓君: 欢迎收听硅谷 101。我是红军,今天跟我在一起的是 Azuki 的内容负责人。二月茶,哈喽。 天宇: 黄军你好。 泓君: 二月你好,我其实叫这个名字还挺不习惯的,是吧可以理解,对对对对。跟听众简单解释一下,天宇的动漫的应该是在网上通用的笔名,是二月茶。 天宇: 对是的是的。一般在 Azuki 做内容的时候就用这个名字,主要是我们在生产的时候,英文中文和日语都会有使用。所以就挑了一个相对来说,三个语言都相对比较好发音的名字。 泓君: 然后天宇在去 Azuki 之前,也是 Google Brain 的工...