审计反火：用证据和风格评估先进的反驳生成

Feb, 2024

审计反火：用证据和风格评估先进的反驳生成

Auditing Counterfire: Evaluating Advanced Counterargument Generation with Evidence and Style

Preetika Verma, Kokil Jaidka, Svetlana Churina

TL;DR我们提出了一个新颖的数据集，用于控制组成反驳论点，旨在进一步应用于论证的改进、挖掘和评估。

Abstract

We present a novel dataset for the controlled composition of counterarguments designed for further applications in argument refining,

counterarguments dataset argument refining mining evaluation

发现论文，激发创造

与我简明辩论：走向句级反驳生成

本研究提出了 ArgTersely 基准和 Arg-LlaMA 模型，使用基于 BERT 的 Arg-Judge 评估器进行了高质量句级反驳生成任务的实验，在与其他基线模型比较中展示了该框架和评估器的竞争力。

Dec, 2023

利用检索、规划和实现的论点生成

本文介绍了一个新的框架 CANDELA，用来解决针对特定问题的对抗论证自动生成，它包含了一个强大的检索系统和一个新型的双步骤生成模型，通过索引 1200 万文章并使用自然语言处理，使得自动生成的对抗论证比以往更为适当和丰富。经过自动评估和人工评估，该模型均取得了相比现有技术的更高 BLEU、ROUGE 和 METEOR 语言分数。

Jun, 2019

基于结论的对抗性论点生成

本文研究如何利用多任务学习来生成经过反驳的论点，并提出了一个基于立场分类的排名组件来选择最优的反驳。评估结果表明，该方法比强基线生成的反驳更相关且立场更明确。

Jan, 2023

为反驳生成增强知识检索

通过结合知识图谱的方式，构建了一种自然语言推断模型，用于从网络的多样化来源中检索能够有效证明陈述错误的证据，从而进一步改进了证据检索系统。

Sep, 2021

ArguMentor: 提升用户体验与对立观点

ArguMentor 设计了一个全套系统，它突出了意见文章中的论点，并利用 LLM 为其生成反驳观点，然后根据当前事件为文章生成基于上下文的摘要。通过额外的功能如问答机器人，辩论和突出触发窗口，该系统进一步增强了用户的交互和理解。我们的调查和结果显示，用户在使用该系统后能够产生更多的反驳观点，并且平均具有更多中立的观点。

Jun, 2024

使用大型语言模型的多方面对抗叙述评估框架

通过新的评估框架，我们提出了一种新颖的方法，让 LLMs 为生成的对抗叙事候选者提供评分和反馈，从而弥补以往评估方法的局限性，并显示出作为多方面、无参考和可解释的对抗叙事评估者的潜力。

Feb, 2024

ArguGPT: 评估、理解和识别由 GPT 模型生成的论证性文章

本文介绍了 ArguGPT 数据集，分析了由大型语言模型生成的英文论述文章的语言学特征，以及用于检测 AIGC 的现有和新型检测器的性能，其中使用的 RoBERTa 检测器在 essay 和 sentence 级别均可达到 90% 以上的准确率。

Apr, 2023

面向知识驱动的仇恨言论反叙事生成

该研究提出一种基于外部知识库的完整反叙事生成管道，以对抗网上仇恨。实验证明，该模型可以在领域内和跨领域环境下生成适合和信息丰富的反叙事。

Jun, 2021

语言模型的批判性思维

本文提出了一种针对神经自回归语言模型的批判性思维课程的初步探索，为此我们介绍了一种综合语料库，并生成人工辩论文本进行训练和评估。结果显示，在核心辩论中进行预训练能够显著提高语言模型的推理能力。本文中介绍的人工辩论文本是构建 “语言模型的批判性思维课程” 的一个有前途的起点。

Sep, 2020

探究自动生成的反事实数据在情感分析中的有效性

提出了一种自动产生对立数据的方法，基于此数据增广训练集可以有效提高 NLP 模型的性能。

Jun, 2021