Apr, 2023
DSVAE: 可解释的分离合成语音检测表示
DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection
Amit Kumar Singh Yadav, Kratika Bhagtani, Ziyue Xiang, Paolo Bestagini, Stefano Tubaro...
TL;DR本文提出使用 Disentangled Spectrogram Variational Auto Encoder (DSVAE) 处理语音谱图以生成可解释的表示,并创建激活映射来区分合成和真实人类讲话信号,通过 ASVspoof2019 数据集获得高精度(>98%)检测多种语音合成器合成的语音。