Apr, 2023

Soundini: 用声音引导的扩散技术进行自然视频编辑

TL;DR本研究提出了一种使用声音引导视觉效果的方法,通过在音频视觉潜在空间中使用音频潜在表示来引导去噪扩散概率模型,利用基于光流的指导生成时间一致的视频帧,生成更具有现实主义的视觉效果。