Nov, 2022

分析多种语言 BERT 变体中存在的社会偏见

TL;DR本研究探讨了预训练语言模型在不同语言中所存在的偏见,提出了一种基于句子假设度量的模板方法来检测偏见,通过该方法分析了每个单语模型。研究发现,检测偏见的方法高度依赖于语言和文化,需要对每种语言和文化的独特表达方式进行深入了解。而与此相关的,我们假设非英语 BERT 模型中更高的社会偏见指数与其训练的用户生成内容有关。