Feb, 2024

平衡的行动:揭示和缓解葡萄牙语ASR偏见

TL;DR本研究旨在全面探索Whisper和MMS系统,重点评估与葡萄牙语的非正式对话语音相关的自动语音识别中存在的偏见。我们的调查包含不同类别,包括性别、年龄、肤色和地理位置。除了传统的ASR评估指标(如词错误率WER)外,我们还引入了p值统计显著性来分析性别偏见。此外,我们广泛研究了数据分布的影响,并实证表明过采样技术可以减轻此类刻板化偏见。本研究通过应用MMS和Whisper在葡萄牙语环境中量化偏见,对多语言设置下ASR系统性能有了更好的理解,是一项开创性的工作。