BriefGPT.xyz
大模型
Ask
alpha
关键词
content moderators
搜索结果 - 2
ACL
Tox-BART:利用毒性属性生成隐含仇恨言论的解释
利用语言模型为隐藏的仇恨帖子生成解释是一个活跃的研究领域,解释的目的是明确潜在的刻板印象并帮助内容管理员。研究通常结合前 k 个相关的知识图谱 (KG) 元组来提供世界知识并改善标准指标的性能,但我们的研究提出了冲突的证据,认为 KG 元组
→
PDF
a month ago
ACL
可解释性与仇恨言论:结构化解释提高社交媒体审核员的速度
通过研究,我们发现,结构化的解释能够降低现实世界的内容审查员的决策时间 7.4%,而通用解释对其速度没有影响且常被忽视。
PDF
a month ago
Prev
Next