May, 2024

回顾:具备特征存储的视频到视频翻译技术

TL;DRStreamV2V 是一种实时的流媒体视频转视频(V2V)翻译方法,通过用户提示实现。它通过维护一个特征库,将过去的信息与当前帧进行融合,在处理无限帧数时,以流媒体方式而非批处理方式进行帧处理。StreamV2V 具有自适应性和高效性的特点,在不需要微调的情况下,与图像扩散模型无缝集成,并能在一个 A100 GPU 上以 20 FPS 的速度运行,比 FlowVid、CoDeF、Rerender 和 TokenFlow 分别快 15 倍、46 倍、108 倍和 158 倍。定量指标和用户研究结果证实了 StreamV2V 保持时间一致性的卓越能力。