MMOct, 2023

鲁棒且不可察觉的音频对抗例子的综合算法

TL;DR音频对抗样本指对自动语音识别系统进行欺骗的音频文件,既能愚弄自动语音识别系统又能在人类听众中听起来正常。本文介绍了一种集成算法,在生成步骤中使用了心理声学模型和房间脉冲响应。我们通过三个实验比较不同方法的效果,包括在模拟环境和真实无线环境中评估鲁棒性,以及在人类研究中评估可感知性。我们的算法在考虑心理声学效果或结合鲁棒性时,信噪比和人类感知研究都有所改善,但错误率有所增加。