Jun, 2024
提炼本质,舍弃瑕疵!通过对事实因果效应进行去偏差处理的有毒语言检测
Take its Essence, Discard its Dross! Debiasing for Toxic Language
Detection via Counterfactual Causal Effect
TL;DR通过引入Counterfactual Causal Debiasing Framework(CCDF)来解决毒性语言检测中的词汇偏见问题,使得模型在准确性和泛化能力上都表现出优秀的性能,并且相较于竞争模型,在公平性方面取得了显著的提升。