counter narrative | BriefGPT

关键词counter narrative

搜索结果 - 4

一种基于 LLM 的评估自动对抗叙事生成方法的排序方法
使用大型语言模型作为评估者，提出了一种对生成的反话进行评估的新方法，通过在锦标赛格式中对生成的反话进行成对比较，建立了一个模型排名流程，并与人类偏好达到了 0.88 的相关性。此外，通过细致的评估和性能分析，发现以聊天为导向的零 - sho
PDF13 days ago
RAUCG：用于对抗仇恨言论的检索增强无监督对抗性叙述生成
使用检索增强的无监督式反叙事生成方法，从外部统计数据中扩展反知识，并将其映射到反叙事，以应对自动生成反叙事所面临的限制。具有出色的性能表现和更强的泛化能力。
PDF9 months ago
ACL使用预训练语言模型生成反对仇恨言论的对比研究
本研究旨在使用预训练的语言模型对抗英语在线仇恨言论，我们发现自回归模型与随机解码结合是最有前途的；同时研究发现成功的反目标试验关键不在于整体相似性，而是训练数据中的特定子集与测试目标的共性。最后，我们提出了一种管道技术，将自动生成的反叙事加
PDF2 years ago
ACL人机协同进行数据采集：一个打击在线仇恨言论的多目标对抗性叙述数据集
本文提出了一种新型的人机交互数据收集方法，其中一个生成式语言模型通过使用其自身数据生成新的训练样本，并由专家审查 / 编辑来迭代地改善。结果表明，该方法可扩展并促进多样化、新颖及高效收集数据。生成的数据集是目前唯一面向专家的多重 HS/CN
PDF3 years ago