Dec, 2023

印度语言的多语言偏见检测和缓解

TL;DR缺乏多元观点导致维基百科内容中的中立偏见,从而使数百万全球读者接触到潜在的不准确信息。因此,中立偏见的检测和缓解是一个关键问题。我们为此提供了两个大型数据集 mWikiBias 和 mWNC,分别涵盖 8 种语言,用于中立偏见的检测和缓解任务。接下来,我们通过将检测建模为二元分类问题和将缓解建模为样式转换问题,研究了流行的多语言基于 Transformer 的模型在这两个任务中的有效性。我们将代码和数据公开提供。