May, 2024

通过扰动损失特征提升自动语音识别模型审计中的成员推断

TL;DR该研究探索了在自动语音识别模型中,利用基于损失的特征与高斯和对抗性扰动进行成员推断 (MI) 的有效性。与常用的基于错误的特征相比,我们提出的特征大大增强了样本级 MI 的性能。对于说话人级 MI,这些特征也改善了结果,尽管改进幅度较小,因为基于错误的特征已经在这个任务中表现出很高的性能。我们的发现强调了在 ASR 系统中考虑不同特征集和访问目标模型的级别对于有效的 MI 的重要性,为审计这些模型提供了有价值的见解。