KDDMay, 2024

具有一般化目标感知公平性的仇恨言论检测

TL;DR为了解决社交媒体平台滥用的副作用,我们提出了一种名为 GetFair 的方法,该方法可以在分类中包含多样且未知的目标,以实现公平地识别含有有毒在线帖子的内容。