CVPRNov, 2022
通过多模态遮挡视频生成实现统一的文本引导视频完成
Tell Me What Happened: Unifying Text-guided Video Completion via Multimodal Masked Video Generation
Tsu-Jui Fu, Licheng Yu, Ning Zhang, Cheng-Yang Fu, Jong-Chyi Su...
TL;DR提供了一个新的任务,即文本引导下的视频完成(TVC),并提出了一种新的模型 —— 多模式蒙版视频生成(MMVG),通过文本输入生成高质量的视频完整图像,同时满足预测,倒带和填充的条件。