通过无监督聚类提高端到端语音识别的公平性和鲁棒性

Jun, 2023

通过无监督聚类提高端到端语音识别的公平性和鲁棒性

Improving Fairness and Robustness in End-to-End Speech Recognition through unsupervised clustering

Irina-Elena Veliche, Pascale Fung

TL;DR本文提出了使用保护隐私的方法来提高自动语音识别的公平性和鲁棒性，通过利用无监督学习从发音级别语音特征中提取得到语音聚类中心作为训练模型的额外特征，实现对任何人群的提高，特别是在不同口音情境下显示出明显改进。

Abstract

The challenge of fairness arises when automatic speech recognition (ASR) systems do not perform equally well for all sub-groups of the population. In the past few years there have been many improvements in overal

automatic speech recognition fairness robustness privacy preserving unsupervised learning

发现论文，激发创造

语音识别公平性：性能差异的发现和缓解

本文研究语音识别中的不公平现象，通过划分发言者的群组并采取公平措施，比较利用地理和人口学信息与扩展的讲者嵌入技术的群组探测方法，发现在过采样和建模讲者群体成员方面均能缩小不同发言者群体间的差距并提高整体精确度。

Jul, 2022

公平 LENS：评估执法语音识别中的公平性

为了确保在不同的音响环境中为不同的人群提供公平性，我们建立了一个系统性的公平评估框架，通过一种新颖且适应性强的评估方法来检查不同模型之间的公平差距，并收集了多种情景和人口学维度的公平评估数据集。我们对 1 个开源和 11 个商业化最先进的 ASR 模型进行了公平评估，结果显示某些模型比其他模型存在更多偏见，这对用户在选择适合特定实际场景的 ASR 模型时提供了公平性指导。我们进一步探讨了模型对特定人口群体的偏见，并观察到音响领域的变化可能导致新的偏见出现。

May, 2024

使用 Common Voice 数据集建立公平的语音识别系统

本文使用法语 Common Voice 数据集对 wav2vec~2.0 模型的偏见进行计量，通过对多种固定大小的、精心制作的训练集进行微调，证明了演讲者多样性的重要性，并对 Common Voice 语料库进行了彻底分析，发现了应该被这个数据集的用户考虑的重要缺陷。

Jun, 2023

深度说话人识别中的偏差与公正研究

本文研究了最近三种受欢迎的公平性定义（统计平等，等概念和等机会）在最新的 SR 系统中的应用情况，测试了 5 种流行的神经架构和 5 种常用的损失函数，以对抗性别和国籍偏见，并发现更复杂的编码器架构符合公平性定义，而损失函数的选择会对 SR 模型的偏见产生显著影响。

Mar, 2023

基于注册的个性化方法，提高语音情感识别中的个体公平性

通过个体差异进行个性化调整，提出了一种适应每个新说话人的 SER 模型的新方法，并提出了用于衡量不同说话人公平性的新颖评估方案。研究结果表明，聚合评估指标可能掩盖个人层面的公平问题，而我们的评估能揭示出这些问题，并且我们提出的方法可以在聚合和分解层面上提高性能。

Jun, 2024

可视化聚类中的公平性：一种新型 Transformer 聚类方法

本文提出了一种新的损失函数和注意力机制，以促进聚类模型的公平性和减少人口统计学偏差，实验结果表明该方法在多个敏感属性上提高了聚类准确性和公平性。

Apr, 2023

低声：带差分隐私保证的联邦语音识别

该研究提供了一种在多个组织之间学习机器学习模型，并提供数学保证限制隐私损失的潜在解决方案，采用联邦学习方法和差分隐私技术构建，并应用于 senone 分类原型，演示了模型随着私有数据的添加而改进，同时尊重隐私。

Jul, 2022

使用敏感子空间鲁棒性训练个体公平的机器学习模型

我们考虑培训机器学习模型，使其在输入的某些敏感扰动下表现不变的公平性，这种公平性的形式化表述为个体公平性的一种变体，并使用分布鲁棒优化方法在训练期间强制执行。我们还展示了该方法在两个容易受到性别和种族偏见影响的机器学习任务上的有效性。

Jun, 2019

语音识别中的隐私保护对抗性表征学习：现实还是幻象？

本文旨在研究自动语音识别中隐私保护的问题，提出了利用深度编码器 - 解码器架构中的预训练技术来保护说话人身份，通过对开放和封闭说话人集的说话人识别和验证实验，论证了对抗训练架构可以显著减少封闭集的分类精度，提高个人隐私保护的效果。

Nov, 2019

通过数据增强改善推荐公平性

本文研究了如何从数据增强的角度提高协同过滤推荐的公平性，通过增强数据集中的不平衡数据来改善其公平性，测试结果表明这种方法能有效提高推荐公平性。

Feb, 2023