Jun, 2024

VIA:全球和本地视频编辑的时空视频调适框架

TL;DRVIA 是一个统一的时空 VIdeo 适应框架,其基础是一种新的测试时间编辑适应方法,用于通过适应预训练的图像编辑模型来提高潜在编辑方向和文本指令之间的一致性,实现精确的本地控制,同时通过进行一致的关注变量适应来维护整个视频序列的全局一致性,以实现编辑效果。实验结果表明,与基准方法相比,使用 VIA 方法进行的编辑更加忠实于源视频,在时空上更加连贯,并具有更精确的本地控制。更重要的是,我们展示了 VIA 可以在几分钟内实现一致的长视频编辑,释放了对长视频序列的高级视频编辑任务的潜力。