Sep, 2023
Syn-Att:通过半监督的未知多类 CNN 集成进行合成音频归属
Syn-Att: Synthetic Speech Attribution via Semi-Supervised Unknown Multi-Class Ensemble of CNNs
Md Awsafur Rahman, Bishmoy Paul, Najibul Haque Sarker, Zaber Ibn Abdul Hakim, Shaikh Anowarul Fattah...
TL;DR通过将语音转化为对数梅尔频谱图,利用半监督学习和集成方法来提高稳健性和泛化性,本文提出了一种将合成语音与生成器相关联的新策略,并在 IEEE SP Cup 2022 的 ICASSP 挑战中,准确率相较 Eval 2 提高了 12-13%,Eval 1 提高了 1-2%。