关键词hate speech
搜索结果 - 194
- IndoToxic2024:一份丰富人口统计数据集,用于印度尼西亚语的仇恨言论和毒性类型PDF7 days ago
- COT:通过对比最优输运生成反对仇恨言论的方法PDF16 days ago
- HateDebias: 关于仇恨言论去偏见的多样性与可变性PDFa month ago
- ACL可解释性与仇恨言论:结构化解释提高社交媒体审核员的速度PDFa month ago
- MM网络评论中的辩论反对策略:分类模式的构建与训练验证PDF2 months ago
- 基于 Transformer 的大型语言模型检测反犹太主义仇恨言论PDF2 months ago
- ICLREkoHate: 针对尼日利亚 Twitter 上政治讨论的混合代码的辱骂性语言和仇恨言论检测PDF2 months ago
- 探索边界和强度:揭示社交媒体言论的复杂范围PDF3 months ago
- 弱监督因果解离下的跨平台仇恨言论检测PDF3 months ago
- OPSD:一种冒犯性波斯社交媒体数据集及其基准评估PDF3 months ago
- 隐含有害内容的目标跨度检测PDF3 months ago
- 中文恶意言语检测:现状与未来方向PDF3 months ago
- 应对仇恨言论的受约束大型语言模型PDF3 months ago
- 细调预训练语言模型用于检测游戏中的垃圾言论PDF3 months ago
- 基于大型语言模型提取理由的可解释仇恨言论检测PDF3 months ago
- 憎恨源于无知!对抗言语仇恨中的说服方式归纳PDF4 months ago
- COLINGHarmPot:用于评估社交媒体文本离线伤害潜力的注释框架PDF4 months ago
- 基于多任务指令调优与 RLAIF 的意图条件和无毒抗辩生成PDF4 months ago
- COLING巴斯克语和西班牙语反叙事生成:数据创建与评估PDF4 months ago
- 可解释性布局对人类对冒犯性句子的感知是否有影响?PDF4 months ago
Prev