BriefGPT.xyz
大模型
Ask
alpha
关键词
counter narrative
搜索结果 - 4
一种基于 LLM 的评估自动对抗叙事生成方法的排序方法
使用大型语言模型作为评估者,提出了一种对生成的反话进行评估的新方法,通过在锦标赛格式中对生成的反话进行成对比较,建立了一个模型排名流程,并与人类偏好达到了 0.88 的相关性。此外,通过细致的评估和性能分析,发现以聊天为导向的零 - sho
→
PDF
13 days ago
RAUCG:用于对抗仇恨言论的检索增强无监督对抗性叙述生成
使用检索增强的无监督式反叙事生成方法,从外部统计数据中扩展反知识,并将其映射到反叙事,以应对自动生成反叙事所面临的限制。具有出色的性能表现和更强的泛化能力。
PDF
9 months ago
ACL
使用预训练语言模型生成反对仇恨言论的对比研究
本研究旨在使用预训练的语言模型对抗英语在线仇恨言论,我们发现自回归模型与随机解码结合是最有前途的;同时研究发现成功的反目标试验关键不在于整体相似性,而是训练数据中的特定子集与测试目标的共性。最后,我们提出了一种管道技术,将自动生成的反叙事加
→
PDF
2 years ago
ACL
人机协同进行数据采集:一个打击在线仇恨言论的多目标对抗性叙述数据集
本文提出了一种新型的人机交互数据收集方法,其中一个生成式语言模型通过使用其自身数据生成新的训练样本,并由专家审查 / 编辑来迭代地改善。结果表明,该方法可扩展并促进多样化、新颖及高效收集数据。生成的数据集是目前唯一面向专家的多重 HS/CN
→
PDF
3 years ago
Prev
Next