scripod.com

EP06 AI 音乐:ACE 如何用开放生态重新定义音乐创作

The Alphaist

Shownote

1| THE ALPHAIST 播客栏目介绍 《The Alphaist》 是一档由 Alphaist Partners 打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新...

Highlights

本期节目深入探讨 AI 音乐领域的范式变革,聚焦 ACE 这家以专业创作者为原点、坚持开放生态战略的创新公司。对话围绕技术路径选择、人机协同哲学与创业实践展开,呈现一场关于音乐创作民主化与产业重构的深度思辨。
02:17
ACE 是全球首个开放生态的 AI 音乐平台
03:21
ACE Studio 2.0 于 2025 年 12 月初发布,进行了系统性大升级
04:08
ACE Studio 2.0 能将创意更快转化为成品,效率提升十倍甚至百倍以上
05:01
ACE Studio 是基于 AI 重塑音乐创作工作流的音乐人 IDE
07:05
抖音主 use case 占用户注意力和价值超 90%,专业产品则需覆盖 corner case 并整合为优雅工作流
08:03
AI 生成音乐质量虽高,但因黑箱随机特性,难打造以创作者为中心的 IP
09:45
Ace Studio 和 Suno Studio 等 AI 工具让音乐创作既高质量又可控且具独特性
11:19
端到端 AI 虽易让人参与创作,但难助人类探索划时代内容形式
13:04
以照相机出现后绘画发展为例,提及对方在专业市场思路清晰
13:44
用户可通过哼唱生成乐谱,再变成小提琴声,经 Music Enhancer 生成完整歌曲,完成好莱坞史诗级弦乐作品
15:40
大模型目前也难内生音乐创作能力
19:36
普通人难以判断音乐标注是否正确,没有音乐能力的团队做此事难以评估
21:00
小学音乐老师、琴童、业余乐队成员等懂音乐的‘New Professionals’开始在 ACE Studio 2.0 上认真创作音乐
23:11
ACE Studio 未来有望吃下该市场 10%-20% 份额
27:30
Ace Music 支持用户本地训练并构建个性化 AI 音乐模型
29:36
一首学生 AI 生成歌曲在 QQ 音乐连续数周排名第一,版权分成近 500 万人民币
32:35
AI 音乐是范式转移和产业革命,不只是效率工具升级
35:20
AI 音乐是最接近 AI 直出且能让终端消费者直接消费的内容
40:19
AI 加持下,音乐消费正向实时情绪配乐和碎片化定制演进
42:08
模型能在普通电脑运行,如 3090 GPU 上 11 秒、A100 上 2 秒可生成完整音乐
44:02
ACE 取胜关键在于开放生态而非开源
48:09
新开源音乐模型可在 A100 显卡上两秒内生成一首歌,支持一次生成十首并自动打分排序
53:53
AI 赋能音乐的核心是走向个性化,而非通用生成
57:25
华人兼具务实、努力和野心,能克服挑战
58:19
音乐本应是大众表达自我的方式,如今创作门槛高是技术发展所致
1:01:04
2022 年因精力分散误判 Suno 训练成本和潜力
1:06:08
2026 年 ACE 最重要的是打通 ACE Music 和 ACE Studio 生态,形成开放的 AI 音乐生产平台

Chapters

ACE Music:开放生态的 AI 音乐平台
00:00
音乐人的 Cursor:ACE Studio 如何重塑专业创作
ACE Studio 起点:解决专业创作者寻找歌声成本过高的问题,用 AI 生成专业级童声合唱
03:21
ACE Studio 2.0:整合歌声合成、乐器生成、端到端音乐生成,好莱坞制作人用它将创作效率提升 10-100 倍
04:03
⭐ Cursor 类比:ACE Studio 是音乐人的 IDE,human in the loop 的创作方式;Suno 更像 Lovart,一键生成
05:01
Corner Case 哲学:专业工具的护城河
专业产品的核心:覆盖更多 corner case 并整合为优雅工作流,需要对创作流程的深刻理解
07:05
插件生态:ACE Studio 可桥接传统 DAW,Suno Studio 作为网页端无法实现
08:03
⭐ 独特性是未来最重要的竞争力:当所有人都能高质量生成,可控的个性化表达才是关键
09:45
Human in the Loop:AI 创作的边界与可能
⭐ 摇滚乐思想实验:训练数据里没有的音乐类型,AI 无法发明;强化学习无法奖励早期的划时代创新
11:18
照相机类比:照相机出现后画师从追求逼真转向现代主义、抽象主义等艺术风格
13:04
原子能力的涌现:ACE Studio 2.0 与数据壁垒
涌现式创作:用户将 vocal to MIDI、AI instrument、music enhancer 等原子能力排列组合,产生全新工作流
13:44
⭐ 模型矩阵:旋律识别、乐器合成、端到端生成、音轨分离等多个专有模型,音乐领域缺乏第三方模型倒逼自建壁垒
15:40
数据标注的 know-how:用 Audio LLM 预标注 2000 万首歌,再用专业音乐人清洗 —— 没有音乐背景的团队 "相当于瞎子做图片模型"
17:37
新专业主义与商业验证
⭐ "New Professionals":钢琴琴童、音乐老师、业余乐队成员……AI 让懂音乐的人都能成为制作人
20:58
市场天花板:2024 年全球音乐专业软硬件市场 150 亿美金,ACE Studio 下限吃下 10%-20%
23:09
单位经济:推理成本约 5-6%,营销成本约 20%,年费 $264
24:42
ACE Music:当 AI 让音乐实现普惠
⭐ QQ 音乐奇迹:高中生用 AI 创作的歌曲数周 QQ 音乐 No.1,版权分成近 500 万人民币
29:33
AI 音乐大于音乐:让人类几千年来用音乐表达情绪的方式真正普惠化
30:42
AI 音乐是最接近 "直出可消费" 的 AI 内容形态,流媒体平台已在主动限制 AI 音乐供给
35:17
分发重构:版权成本是流媒体命脉,AI Remix 改变消费方式,传统平台面临商业模式冲突
36:39
开源与开放生态:用所有模型联合打败 Suno
⭐ 开源 + 免费策略:模型可本地部署,3090 显卡 11 秒生成一首歌
42:04
开放生态:整合自有、第三方、开源、闭源所有音乐模型,类比 OpenRouter
43:59
Flux 式商业模式:小模型免费传播→中模型商用授权→大模型闭源 API
46:03
⭐ 开源必追闭源:音乐模型非资源密集型,算法和数据创新是小公司超越大公司的关键
49:43
创业七年:从至暗时刻到 All In AI Music
选择 LA 而非硅谷:靠近用户比靠近资本更重要,Studio City 是全球音乐制作中心
55:31
⭐ 创业初心:音乐不应是少数人垄断的高级形式,而是每个人表达情绪的方式
58:14
至暗时刻:2022 年被其他项目分散精力,眼看 Suno 将自己的愿景做到世界级
1:01:04
All In 决定:2024 年初飞美途中十几小时讨论,砍掉所有项目只做 AI Music
1:02:26

Transcript

Joe(郭靖): AI 音乐可能甚至是一个大于音乐本身的事情,因为它会彻底的让人类创作出来的这种几千年的人们都长期需要的内容模式,真正的实现了普惠化。因为这个模式。音乐是一个很独特的东西,它其实是代表人类的情绪的延伸,但今天音乐的生产不是一个普惠的东西。那么所有人都有情绪,每个人的情绪都不一样,但是不是所有人都有能力去用音乐去表达的。今天 AI Remix,你可以把任何一个名人的歌,送进去模型,然后 Remix 成你自己喜欢的样子。但又保留了它的歌血的成分。也就是说你消费音乐的方式,已经变了,创作可能也是一...
小宇宙
Open in 小宇宙