Jun, 2023

Diff-Foley: 基于潜在扩散模型的同步视频 - 音频合成

TL;DR使用 Diff-Foley 方法和潜在扩散模型进行音频与视频同步生成,其在现有的大规模数据集上取得了最先进的性能。