利用自然推理证明获取短语对应关系
提出了一个基于将文本转换为抽象意义表示(AMR)图的新型流水线,通过预训练的 AMR 解析器将 AMR 图转换为命题逻辑,并使用 SAT 求解器进行自动推理,引入了松弛方法以允许替换或遗忘某些命题。实验结果表明该流水线在四个 Recognizing Textual Entailment 数据集上表现良好。
May, 2024
本文介绍 PaRTE,一组 1126 个文本蕴含例子,用来评估模型是否对改写具有鲁棒性。文章指出,如果 RTE 模型真正理解语言,那么它们的预测应该在具有相同意义的输入之间保持一致。作者使用这个评估集合以确定 RTE 模型在对例子进行改写时是否会改变它们的预测。通过实验发现,当文本改写时,现代模型对 8-16% 的例子进行了预测更改,这表明仍有提高空间。
Jun, 2023
本文提出了一种通过将浅层特征和句子对之间的双向蕴涵关系的自然演绎证明的特征相结合的方法来确定语义文本相似度的方法,并使用 ccg2lambda 实现自动推理。实验表明,本方法能够超越其他逻辑方法,并且证明导出的特征对学习文本相似度很有效。
Jul, 2017
本论文介绍了一种用于比较不同 NLP 系统语义理解能力的统一性评估框架 ——Recognizing Textual Entailment (RTE),并提供了评估 NLP 系统推理能力的不同方法的概述,重点介绍了 RTE 数据集的特点及其最新研究进展,提出了利用注重特定语言现象的新引入的 RTE 数据集来评估 NLP 系统的建议。
Oct, 2020
本研究提出了 ParaPattern,该方法利用自动化流程从维基百科生成训练数据,并使用 BART 模型在无直接人类监督下从多样的自然语言输入中生成演绎推理,结果表明,ParaPattern 模型在无领域训练数据的情况下,表现优于基线系统。
Apr, 2021
提出了一个处理模糊的假设的新系统,使用自然语言生成模型来从一个前提中推出另一个前提并以双向的方式搜索。 使用回路验证程序过滤质量不佳的生成来确保正确性。 该系统在修改后的 EntailmentBank 数据集和名为 “Everyday Norms:Why Not?“的新数据集上表现出可以恢复跨领域和非领域的前提的能力。
Nov, 2022
这篇文章介绍了一种新的基于强化学习的弱监督的改述系统 ERAP,通过使用现有的改述和自然语言推理 (NLI) 语料库进行训练,可以生成符合给定蕴涵关系且质量良好的改述,经实验证明,使用 ERAP 来增强下游的文本蕴涵任务训练数据可以提高性能并减少训练异常,表明了在改述过程中显式控制的好处。
Mar, 2022
本论文研究语言和计算方面在短语、从句、句子和段落之间可能存在的意义关系,特别关注了近义词替换、文本蕴涵、矛盾和语义相似性,并探讨了量化语义相似度的不同方法,以及自动化的近义词识别。
Aug, 2022