May, 2024

公平 LENS:评估执法语音识别中的公平性

TL;DR为了确保在不同的音响环境中为不同的人群提供公平性,我们建立了一个系统性的公平评估框架,通过一种新颖且适应性强的评估方法来检查不同模型之间的公平差距,并收集了多种情景和人口学维度的公平评估数据集。我们对 1 个开源和 11 个商业化最先进的 ASR 模型进行了公平评估,结果显示某些模型比其他模型存在更多偏见,这对用户在选择适合特定实际场景的 ASR 模型时提供了公平性指导。我们进一步探讨了模型对特定人口群体的偏见,并观察到音响领域的变化可能导致新的偏见出现。