KDDMay, 2024
具有一般化目标感知公平性的仇恨言论检测
Hate Speech Detection with Generalizable Target-aware Fairness
Tong Chen, Danny Wang, Xurong Liang, Marten Risius, Gianluca Demartini...
TL;DR为了解决社交媒体平台滥用的副作用,我们提出了一种名为 GetFair 的方法,该方法可以在分类中包含多样且未知的目标,以实现公平地识别含有有毒在线帖子的内容。