- COLING大型语言模型中的论证质量评估
对有争议问题的论述的计算处理在自然语言处理领域进行了广泛研究,其中论证质量评估是一个关键且具有挑战性的任务。本文提出了利用大型语言模型,通过系统指导其熟悉论证理论和场景以及解决相关问题的方式,以实现更可靠的论证质量评估,同时讨论了由此而产生 - EMNLP自动语料库构建在学习者论证中的省略与重构检测中的应用
该研究介绍了两个新学习者论证任务:识别论证中的缺陷(省略式推理检测)和填补这些缺陷(省略式推理重建)。通过从学习者的论证文本中删除对于论证和质量至关重要的论证单元(ADUs)的方法,我们创建了一个用于省略式推理检测和重建的语料库,以便帮助学 - ACL基于相似度加权的上下文通识知识图构建,用于知识密集型论证任务
本文提出了构建上下文常识知识图谱的新方法,使用语义相似性计算知识图谱三元组和文本论点之间的相似度,从而提取连接论点和前提的上下文化路径,并组合成去噪的上下文常识知识图谱来补充没有明确陈述的论证过程,所得结果在评估任务中显示出了很高的正确率。
- 利用定义提高论点背后人类价值预测 —— SemEval-2023 任务 4 上的 Epicurus
我们进行了实验,旨在识别论据背后的人类价值观,通过在模型训练过程中引入人类价值观的定义来提高预测性能,结果表明我们提出的模型相比于挑战组织者的基线模型表现更好,宏 F1 分数提高了高达 18%。
- 用于辨识论据背后的人类价值观的 Touché23-ValueEval 数据集
我们提出了 Touché23-ValueEval 数据集,用于识别论据背后的人类价值观,并通过自动化检测方法,从 6 个不同源头的 9324 个论点中收集数据。该数据集相对于之前的数据集表现更好,尽管标签分布使分类难度增加,但更大的数据集可 - 两轮辩论无助于人类回答难度较高的阅读理解问题
本文研究采用竞争型答案选项辩论的形式帮助人类答题,并考察了增加反驳环节是否对人类有帮助。结果显示,在阅读理解问题的场景下,辩论并不是一种有效的帮助方式。
- 通过论证学习实现可解释性人工智能
本文研究了从 ' 案例模型 ' 中学习参数,探究 Verheij 提出的案件模型是否可以用于从其他类型数据集中学习参数,并将其与 HeRO 算法和决策树进行比较。
- ACL从争论到关键点:自动争论摘要化
本文提出了将大量讨论中的摘要表示为少量关键点的想法,并根据其显著性对每个关键点进行评分。通过分析大型数据集及实验结果表明,针对一个特定话题,少量关键点通常足以涵盖绝大部分的讨论内容,同时也发现领域专家通常可以提前预测这些关键点。文章探讨了将 - AAAI解决对话中的短语省略:你为什么问 “为什么”?
本文介绍了消解仅含一个词的问句(在语言学中称为 sluices)的新颖任务:ellipsis resolution,并提供了一个由超过 4000 个对话中的 sluices 注释的众包数据集,以及一系列强基准架构。
- 对话中句子论点相似度评估
本研究旨在通过自动提取社交媒体对话中的论点,计算其之间的相似度以识别和归纳辩论方面,从而产生类似于辩论网站上的自动摘要。结果表明,在三个不同的辩题上,本研究的相关性平均值为 0.63,优于几个基准模型。
- ACL基于神经网络的观点和论证摘要生成
用基于注意力机制的神经网络模型,依据重要性进行采样的方法,生成更优于现有方法的电影评论和争论的摘要。
- MM推荐辩论中涵盖范围最广的反对和支持论点
本研究使用加权二分图,解决直接民主网络(DirectDemocracyP2P)中的投票者签名和讨论决定中合并和推荐不同类型的辩论建议的问题。
- 分类器功能下的参数排序
本文提出围绕排名意义的语义学方法,其中的类别函数可赋予强度值给一个论点系统,通过应用固定点技术解决函数存在性和唯一性问题,并指出该语义满足排名语义应具有的公理条件。