审计反火:用证据和风格评估先进的反驳生成
本研究提出了 ArgTersely 基准和 Arg-LlaMA 模型,使用基于 BERT 的 Arg-Judge 评估器进行了高质量句级反驳生成任务的实验,在与其他基线模型比较中展示了该框架和评估器的竞争力。
Dec, 2023
本文介绍了一个新的框架 CANDELA,用来解决针对特定问题的对抗论证自动生成,它包含了一个强大的检索系统和一个新型的双步骤生成模型,通过索引 1200 万文章并使用自然语言处理,使得自动生成的对抗论证比以往更为适当和丰富。经过自动评估和人工评估,该模型均取得了相比现有技术的更高 BLEU、ROUGE 和 METEOR 语言分数。
Jun, 2019
本文研究如何利用多任务学习来生成经过反驳的论点,并提出了一个基于立场分类的排名组件来选择最优的反驳。评估结果表明,该方法比强基线生成的反驳更相关且立场更明确。
Jan, 2023
ArguMentor 设计了一个全套系统,它突出了意见文章中的论点,并利用 LLM 为其生成反驳观点,然后根据当前事件为文章生成基于上下文的摘要。通过额外的功能如问答机器人,辩论和突出触发窗口,该系统进一步增强了用户的交互和理解。我们的调查和结果显示,用户在使用该系统后能够产生更多的反驳观点,并且平均具有更多中立的观点。
Jun, 2024
通过新的评估框架,我们提出了一种新颖的方法,让 LLMs 为生成的对抗叙事候选者提供评分和反馈,从而弥补以往评估方法的局限性,并显示出作为多方面、无参考和可解释的对抗叙事评估者的潜力。
Feb, 2024
本文介绍了 ArguGPT 数据集,分析了由大型语言模型生成的英文论述文章的语言学特征,以及用于检测 AIGC 的现有和新型检测器的性能,其中使用的 RoBERTa 检测器在 essay 和 sentence 级别均可达到 90% 以上的准确率。
Apr, 2023
本文提出了一种针对神经自回归语言模型的批判性思维课程的初步探索,为此我们介绍了一种综合语料库,并生成人工辩论文本进行训练和评估。结果显示,在核心辩论中进行预训练能够显著提高语言模型的推理能力。本文中介绍的人工辩论文本是构建 “语言模型的批判性思维课程” 的一个有前途的起点。
Sep, 2020