Jun, 2023

文本到视频模型的概率适应

TL;DR探索如何适应大规模预训练的文本到视频模型到多个下游领域和任务而无需微调的问题,我们提出了 Video Adapter,它利用了大型预训练视频扩散模型的分数函数作为概率先验来指导任务特定的小型视频模型的生成,实验结果表明 Video Adapter 能够将大型预训练视频模型的广泛知识和高保真度融合到能够在动画、自我建模和模拟以及真实世界机器人数据建模等多种任务中生成高质量且专业的视频。