Jul, 2023

ADD Challenge 2023 音频多模块深度伪造生成系统

TL;DR本文建立了一个端到端的多模块合成语音生成模型,包括说话者编码器、基于 Tacotron2 的合成器和基于 WaveRNN 的声码器,并在不同数据集和模型结构上进行了大量比较实验。最终,我们在 ADD 2023 挑战赛中荣获第一名,加权欺骗成功率为 44.97%。