May, 2023

利用文图扩散模型实现一致的视频编辑

TL;DR本文提出了EI ^ 2模型,主要解决Text-to-Image的视频编辑中存在的文本指示不一致和时间序列问题,通过引入Shift-restricted Temporal Attention Module (STAM)和Fine-coarse Frame Attention Module (FFAM)解决协变量漂移问题以及合理利用局部和全局信息,提高编辑的一致性。