Apr, 2021

社交媒体上毒性建模中的跨地理偏见检测

TL;DR本文提出了一种弱监督的方法来检测在更广泛的地理文化背景下的词汇偏见,通过公开获取的有毒检测模型案例研究,展示了我们的方法如何识别跨地理误差的显著群体,并展示这些分组如何反映这些地理背景下人类对攻击性和无攻击性语言的判断.