KDDJul, 2023

减少对话中的偏见:借助提示的仇恨言论分类器和去偏器

TL;DR提出了一种两步骤的方法,通过一个分类器检测仇恨言论,然后利用去偏见的组件生成较少偏见或无偏见的替代方案,从而减少在线讨论中负面影响和偏见。