CVPRNov, 2022

通过多模态遮挡视频生成实现统一的文本引导视频完成

TL;DR提供了一个新的任务,即文本引导下的视频完成(TVC),并提出了一种新的模型 —— 多模式蒙版视频生成(MMVG),通过文本输入生成高质量的视频完整图像,同时满足预测,倒带和填充的条件。