Jan, 2024
T-FOLEY:一种可控的波形领域扩散模型用于时间事件引导的福利音合成
T-FOLEY: A Controllable Waveform-Domain Diffusion Model for Temporal-Event-Guided Foley Sound Synthesis
Yoonjin Chung, Junwon Lee, Juhan Nam
TL;DRT-Foley 是一种基于时间事件引导的波形生成模型,用于合成弗雷音效。该模型利用声音类别和时间事件特征生成高质量的音频,并且在客观和主观评估指标上显示出卓越的性能,能够与时间事件很好地同步生成 Foley 音效。