Nov, 2024

语音数据在降低毒性检测偏差中的作用

TL;DR本研究探讨了文本毒性检测系统在处理提及特定人群时的偏差问题,尤其关注语音数据是否能缓解这些偏差。通过对多语言MuTox数据集进行高质量的群体注释,研究发现利用语音数据可以有效降低对群体提及的偏见,尤其是在含糊和引发争议的样本中。研究结果强调改善分类器而非转录流程对于减少群体偏见的重要性。