Mar, 2024

VidProM:用于文本到视频扩散模型的百万级实时提示展示数据集

TL;DRSora 带来了文本到视频扩散模型的新时代,它在视频生成和潜在应用方面取得了重大进展;本文介绍了 VidProM,这是第一个由真实用户提供的包含 167 万个文本到视频提示的大规模数据集,并探讨了与之相关的研究领域和新的研究方向。