E211｜站在内容创作者与机器人的交界处：聊聊 3D 数字人的进化

硅谷101

2025/10/24

Overview Shownote Highlights Transcript Chapters Pins

随着 AI 技术的飞速发展，3D 数字人正从虚拟走向现实，成为连接人机交互的新桥梁。本期节目邀请长期深耕 AI 与动画交叉领域的专家柴金祥教授，探讨如何跨越从生成视频到实时互动的技术鸿沟。

柴金祥回顾了从机器人控制转向 3D 数字人动画的研究历程，指出 Text-to-3D 的核心在于参数化建模与多模态输出，而非单纯的像素生成。通过自研的文生 3D 多模态大模型 “星云平台”，魔珐科技实现了文本到语音、表情、动作的一体化生成，并大幅降低渲染成本，使 3D 数字人可在低算力设备运行。当前 B 端企业广泛采用统一虚拟形象，C 端则迈向个人数字分身。规模化落地仍需突破质量、延迟与成本三重挑战。更深远的是，3D 数字人的动作数据正反哺机器人领域，推动具身智能发展。尽管动力学控制和现实泛化仍是瓶颈，但借助强化学习与 VLA 模型，机器人正从 “白盒” 调试迈向 “黑盒” 端到端决策，预示着智能体在虚拟与现实世界融合的未来路径。