BriefGPT.xyz
Ask
alpha
关键词
toxic language detection
搜索结果 - 3
提炼本质,舍弃瑕疵!通过对事实因果效应进行去偏差处理的有毒语言检测
通过引入 Counterfactual Causal Debiasing Framework(CCDF)来解决毒性语言检测中的词汇偏见问题,使得模型在准确性和泛化能力上都表现出优秀的性能,并且相较于竞争模型,在公平性方面取得了显著的提升。
PDF
a month ago
ACL
COBRA 框架:有关攻击性言论的影响和伤害的情境推理
本文提出了 COBRA 框架,这是第一种上下文感知的形式主义,用于解释有害或有偏见言论的意图、反应和危害,着重于其社会和情境背景。我们创建了 COBRACORPUS 数据集,并发现上下文不敏感模型的解释显着劣于上下文感知模型,特别是在上下文
→
PDF
a year ago
ACL
ToxiGen:一个大规模机器生成的用于对抗和隐式仇恨言论检测的数据集
本论文介绍了 ToxiGen,一个新的大规模自动生成的 274k 毒性和良性陈述数据集,用于检测涉及 13 个少数群体的文本。通过使用基于展示的提示框架和诱导循环解码方法来生成微妙的毒性和良性文本,ToxiGen 能够覆盖范围更广的暗含毒性
→
PDF
2 years ago
Prev
Next