Sep, 2023

Syn-Att:通过半监督的未知多类 CNN 集成进行合成音频归属

TL;DR通过将语音转化为对数梅尔频谱图,利用半监督学习和集成方法来提高稳健性和泛化性,本文提出了一种将合成语音与生成器相关联的新策略,并在 IEEE SP Cup 2022 的 ICASSP 挑战中,准确率相较 Eval 2 提高了 12-13%,Eval 1 提高了 1-2%。