Nov, 2023

VideoDreamer: 自定义多主题文本到视频生成与解藕混合微调

TL;DR一个名为 VideoDreamer 的框架填补了现有工作在生成单一主题视频上的不足,它通过利用预训练稳定扩散,潜变量运动动力学和时间交叉帧注意力来生成多主题的文本引导视频。该项目还引入了一个用于评估定制多主题文本到视频生成模型的基准测试集 MultiStudioBench。