ACLFeb, 2024

平衡的行动:揭示和缓解葡萄牙语 ASR 偏见

TL;DR本研究旨在全面探索 Whisper 和 MMS 系统,重点评估与葡萄牙语的非正式对话语音相关的自动语音识别中存在的偏见。我们的调查包含不同类别,包括性别、年龄、肤色和地理位置。除了传统的 ASR 评估指标(如词错误率 WER)外,我们还引入了 p 值统计显著性来分析性别偏见。此外,我们广泛研究了数据分布的影响,并实证表明过采样技术可以减轻此类刻板化偏见。本研究通过应用 MMS 和 Whisper 在葡萄牙语环境中量化偏见,对多语言设置下 ASR 系统性能有了更好的理解,是一项开创性的工作。