Jan, 2024

T-FOLEY:一种可控的波形领域扩散模型用于时间事件引导的福利音合成

TL;DRT-Foley 是一种基于时间事件引导的波形生成模型,用于合成弗雷音效。该模型利用声音类别和时间事件特征生成高质量的音频,并且在客观和主观评估指标上显示出卓越的性能,能够与时间事件很好地同步生成 Foley 音效。