Aug, 2023

复数值神经网络用于语音反欺骗

TL;DR本文介绍了一种新的方法,通过使用复数值神经网络处理输入音频的 CQT 频域表示,结合了幅度谱图和原始音频处理方法的优点,既保留了相位信息又可使用可解释人工智能方法,结果表明该方法在 “野外” 反欺诈数据集上优于先前的方法,并通过可解释人工智能解释结果,剔除研究证明该模型已学会使用相位信息来检测声音伪造。