声音防御：语音转换的对抗攻击

May, 2020

Defending Your Voice: Adversarial Attack on Voice Conversion

Chien-yu Huang, Yist Y. Lin, Hung-yi Lee, Lin-shan Lee

TL;DR论文报告了首次对语音转换进行对抗性攻击的尝试，以保护用户的隐私和身份识别。在两个现有的零样本语音转换模型上进行了实验，显示攻击样本具有良好的隐蔽性和转换效果显著。

Abstract

Substantial improvements have been achieved in recent years in voice conversion, which converts the speaker characteristics of an utterance into those of another speaker without changing the linguistic content of the utterance. Nonetheless, the improved conversion technologies also led to concerns about →

voice conversion adversarial attack privacy authentication zero-shot models

发现论文，激发创造

评估基于语音转换的隐私保护对抗已知攻击者的有效性

本文考察了基于语音转换的匿名化方法，在三种攻击情景中比较了两种基于频率扭曲的转换方法和一种基于深度学习的方法，结果表明语音转换方案不能有效地防止具有广泛知识的攻击者，但可能为不太熟悉的攻击者提供一定的保护。

Nov, 2019

音频对抗样本：利用语音面具的攻击

我们构造了针对自动语音转文字系统的音频对抗样本，并将其应用于五种最先进的语音转文字系统，实验证明这些对抗样本可以欺骗机器，但人类可以轻易地辨识出其中的话语。这一攻击的可行性为研究机器和人类对话语的感知提供了一个新的领域。

Feb, 2021

对抗样本攻击自动语音识别

本篇论文针对语音分类模型进行了首次对抗攻击的研究，其算法成功实现了目标化攻击，并未改变人类听众对音频剪辑的感知。

Jan, 2018

保留语音特征的零 - shot 多音系转换

研究使用对抗学习来实现口音转换，能够将说话者的声音身份保留下来，并可将未知说话者的话语转换为多种口音，主观评估显示该模型生成更接近目标口音且类似于原说话者的音频。

Nov, 2022

深度说话人识别系统的对抗攻击与防御策略

本文研究了深度说话人识别系统所面临的对抗攻击问题，尝试了多种防御方法，并且实验证明了对抗攻击可能会导致准确度降至 0%，并且发现了以投影梯度下降为基础的对抗训练方法是最好的防御手段。

Aug, 2020

通过心理声学隐藏对自动语音识别系统进行对抗攻击

本文介绍了一种新型的基于心理声学隐蔽技术的对抗样本，利用 DNN 实现音频输入的提取并利用 backpropagation 算法实现对抗扰动的插入，成功攻击了最先进的语音识别系统，且人耳听不到插入的对抗扰动。

Aug, 2018

音频对抗样本：针对语音转文本的有目标攻击

利用白盒迭代优化算法针对 Mozilla 的 DeepSpeech 实现针对性的音频对抗性样本进行攻击，成功率为 100％，这种攻击的可行性引入了研究对抗性样本的新领域。

Jan, 2018

针对物理攻击的稳健音频对抗样本

本研究提出了一种生成音频对抗样本的方法，可以在实际场景中攻击一种最先进的语音识别模型。通过模拟播放或录制的变换并将这些变换融合到生成过程中，我们得到的对抗样本具有鲁棒性，能够在不被人类察觉的情况下进行攻击，这表明所提出的音频对抗样本可能会成为一个真正的威胁。

Oct, 2018

面向说话人识别的音频对抗样本理解与缓解

本文系统地探究了基于转换和对抗训练的防御策略，提出了 22 种不同的转换方法，深入评估它们在主要攻击手段下的防御能力，以及对其作用的理解，为进一步的研究提供了有用的洞见和发现，并创建了评估平台 SPEAKERGUARD。

Jun, 2022

对端对端说话人验证的对抗性样本欺骗

本文表明，最近提出的使用端到端深度神经模型训练的说话人验证系统容易受到对抗性样本攻击，攻击后该系统的准确性会降低并且误判率会显著增加

Jan, 2018