Jun, 2024

提炼本质,舍弃瑕疵!通过对事实因果效应进行去偏差处理的有毒语言检测

TL;DR通过引入 Counterfactual Causal Debiasing Framework(CCDF)来解决毒性语言检测中的词汇偏见问题,使得模型在准确性和泛化能力上都表现出优秀的性能,并且相较于竞争模型,在公平性方面取得了显著的提升。