Apr, 2023

DSVAE: 可解释的分离合成语音检测表示

TL;DR本文提出使用 Disentangled Spectrogram Variational Auto Encoder (DSVAE) 处理语音谱图以生成可解释的表示,并创建激活映射来区分合成和真实人类讲话信号,通过 ASVspoof2019 数据集获得高精度(>98%)检测多种语音合成器合成的语音。