通用反驳数据集
本文研究如何利用多任务学习来生成经过反驳的论点,并提出了一个基于立场分类的排名组件来选择最优的反驳。评估结果表明,该方法比强基线生成的反驳更相关且立场更明确。
Jan, 2023
本文介绍了一个新的框架 CANDELA,用来解决针对特定问题的对抗论证自动生成,它包含了一个强大的检索系统和一个新型的双步骤生成模型,通过索引 1200 万文章并使用自然语言处理,使得自动生成的对抗论证比以往更为适当和丰富。经过自动评估和人工评估,该模型均取得了相比现有技术的更高 BLEU、ROUGE 和 METEOR 语言分数。
Jun, 2019
本文提出使用自动挖掘新闻文章中的争议性观点,在辩论中寻找其对应的观点,并通过对英文辩论的 400 次演讲分析,证明了这种方法的可行性,并提供了基础的检测措施,所有数据均可供研究者免费使用。
Jul, 2019
本研究提出了 ArgTersely 基准和 Arg-LlaMA 模型,使用基于 BERT 的 Arg-Judge 评估器进行了高质量句级反驳生成任务的实验,在与其他基线模型比较中展示了该框架和评估器的竞争力。
Dec, 2023
通过对模型生成的矛盾回应进行广泛分析,我们构建了一个大型数据集,并获取了这些模型生成的矛盾的特征,最后展示了该数据集如何大幅提升数据驱动的矛盾抑制方法的性能。
Mar, 2024
本研究旨在有效收集应对仇恨言论的响应,利用大规模的无监督语言模型生成银标注数据,并采用最佳注释策略 / 神经网络架构来进行专家验证 / 后期编辑。
Apr, 2020
通过引入一个涵盖辩论中各项任务的论证挖掘数据集,我们评估了多种生成基准模型,并发现虽然它们在个别任务上表现出有希望的结果,但在全部任务上的整体性能明显下降,这对于我们提出的数据集提出了挑战,需要进一步研究端到端的论证挖掘和概括。
Jun, 2024