Oct, 2023

反犹太主义有多毒?自动化评分反犹在线内容的潜力和局限

TL;DR使用手动注释的德语数据集,这篇论文研究了 Google 和 Jigsaw 的 Perspective API 在检测反犹太主义在线内容方面的潜力和局限性,并发现它在基本水平上能够识别反犹内容为有毒,但对于隐晦形式的反犹主义和批评立场的文本显示出严重弱点,而且通过简单的文本改动,可以大幅降低 API 分数,从而相对容易绕过基于该服务的内容审查。