May, 2024

流媒体传播:使用传播模型进行在线视频编辑

TL;DR我们提出了一种名为在线视频编辑的新任务,旨在在保持时间一致性的同时编辑流式帧。我们提出了 Streaming Video Diffusion(SVDiff)来解决此问题,它将紧凑的空间感知时间回归与现成的稳定扩散相结合,并采用分段级方案在大规模长视频上进行训练。通过这种简单而有效的设置,我们可以获得一个能够执行各种视频并具有时序连续性的单一模型。我们的实验表明,我们的模型能够以 512x512 的分辨率实现 15.2 FPS 的实时推理速度,对于长时间、高质量的视频编辑表现出色。