Vol.26 对谈生数科技 CTO 鲍凡:视频模型迎来了「首次涌现」,视觉更有可能通往 AGI
AI局内人 | AGI Insider
2024/12/04
Vol.26 对谈生数科技 CTO 鲍凡:视频模型迎来了「首次涌现」,视觉更有可能通往 AGI
Vol.26 对谈生数科技 CTO 鲍凡:视频模型迎来了「首次涌现」,视觉更有可能通往 AGI

AI局内人 | AGI Insider
2024/12/04
Unprocessed episode, you can be the first!
Shownote
Shownote
Sora 基于 DiT(Diffusion Transformer)架构,把长视频生成的效果提高到了前所未有的水平,也掀起了全球范围内的视频生成热潮。 11 月份,作为国内代表的视频模型公司,生数科技发布了旗下产品 Vidu 的 1.5 版本,全新上线「多图参考」功能,官方介绍该版本实现了视频生成模型的新突破:突破「一致性」难题、理解多样化的输入。 尤其是,多主体一致性的能力,可以说是解决了视频生成模型的「杀手级」难题。 对比文本生成模型的话,这可以说是视频模型的「首次智能涌现」。 事实上,Vidu...
Highlights
Highlights
Chapters
Chapters
Transcript
Transcript

Open in 小宇宙