Jan, 2025

通过轻量适配器和时间感知反演提升低成本视频编辑

TL;DR本研究解决了基于扩散模型的文本到图像生成在视频编辑过程中时间一致性不足的问题。提出了一种通用高效适配器(GE-Adapter),通过引入时间一致性块、空间一致性块和语义一致性模块,显著提高了感知质量和时间连贯性。研究结果表明,该方法在MSR-VTT数据集上实现了显著的质量提升,提供了切实可行的文本到视频编辑解决方案。