Dec, 2023

Fairy: 快速并行指导视频到视频合成

TL;DR本文介绍了 Fairy,这是一种最简化但稳健的图像编辑扩散模型的改进,为视频编辑应用提供增强。我们的方法集中在基于锚点的跨帧注意力的概念上,这种机制隐式地在帧之间传播扩散特征,从而确保更好的时间相干性和高保真合成。Fairy 不仅解决了先前模型的局限性,包括内存和处理速度。它还通过一种独特的数据增强策略改善了时间一致性。这种策略使得模型对源图像和目标图像的仿射变换是等变的。令人惊讶的是,Fairy 可以在 14 秒内生成 120 帧的 512x384 视频(30 FPS,4 秒时长),至少比之前的工作快 44 倍。一项涉及 1000 个生成样本的综合用户研究证实,我们的方法提供了卓越的质量,在性能上明显胜过已建立的方法。