分治法用于依存关系感知的多跳证据检索

ACLNov, 2023

分治法用于依存关系感知的多跳证据检索

Divide & Conquer for Entailment-aware Multi-hop Evidence Retrieval

Fan Luo, Mihai Surdeanu

TL;DR通过考虑多种相关性信号，我们将多跳问题回答的证据检索任务划分为两个子任务：语义文本相似度和推理相似度检索。我们提出了两种集成模型 EAR 和 EARnest，分别处理每个子任务，然后考虑不同的相关性信号对句子进行重新排序。在 HotpotQA 上的实验证明，我们的模型不仅显著优于基于单一检索模型，而且比两个直观的集成基准模型更有效。

Abstract

Lexical and semantic matches are commonly used as relevance measurements for information retrieval. Together they estimate the semantic equivalence between the query and the candidates. However, →

information retrieval semantic equivalence textual entailment multi-hop question answering ensemble models

发现论文，激发创造

关于相关性和蕴含的句子嵌入联合学习

研究了在信息检索中识别文本蕴含问题的模型，使用了多种变量的神经网络模型，提出了基本的蕴含证据集成模型并展示了其有效性，同时引入了一个基准数据集并在其上进行了实验，并应用该模型于多选题答案排序任务达到了最新的研究效果。

May, 2016

将蕴涵关系应用于多跳问答任务中

通过引入 Multee, 一种能够有效使用预训练自然语言推理模型的通用结构，本文在 MultiRC 和 OpenBookQA 这两个多阶段问题回答的数据集上进行了实验。使用 NLI 预训练模型的 Multee 模型在性能上明显优于仅在目标数据集上进行训练的 QA 模型和 OpenAI 迁移学习模型。

Apr, 2019

一个基于问题蕴涵的问答方法

本文提出了一种新的基于问题蕴含识别（Recognizing Question Entailment）的问答（Question Answering）方法，基于机器学习和深度学习算法，结合信息检索模型，在医疗领域实现了显著的问答准确率提升。

Jan, 2019

通过经验文本表示的语义特征实现文本蕴涵识别

本文提出了一种新的基于阈值的语义文本表示方法，并结合机器学习算法应用语义和词汇特征对文本 - 假设对进行分类，该技术有效地丰富了文本的语义信息，在文字蕴涵分类任务中在意义理解方面的表现明显优于已知方法

Oct, 2022

通过多模态蕴含修订图像 - 文本检索

本论文提出了一种多模态蕴含分类器来确定图像的语句，以及开发了一种通用可调节学习速率策略来教授一个检索模型区分这些蕴含的语句和其他负样本。在实验中，我们手动注释了一个蕴含更正的图像文本检索数据集用于评估。结果表明，所提出的蕴含分类器达到了约 78% 的准确度，并持续提高了图像文本检索基线的性能。

Aug, 2022

透过文本蕴含准确而细致地评估开放问题回答

我们提出研究答案的蕴含关系，以识别更具信息量和更一般化的系统答案，从而更接近人类判断，无需学习。我们提出的蕴含关系评估可通过量化答案之间的推断差距来分配奖励或部分分数，实现对答案正确性的细致排序，其 AUC 比目前的方法更高。

May, 2024

多步骤基于实体的信息检索用于多跳问答

本文介绍了一种信息检索技术，利用最初检索到的证据中存在的实体信息来学习到其他相关证据，并在超过 500 万个维基百科段落的语境下，取得了显着的检索性能提升。此外，检索到的证据还使得现有的 QA 模型（无需任何训练）在 Hotpot 基准测试中 F1 指标提升了 10.59 个点。

Sep, 2019

基于文本推理的事件论元提取：多源学习实现零 - 和少样本

本文通过使用预训练推理模型，将事件论元抽取等 NLP 任务转化为文本蕴涵任务，证明了文本蕴涵模型在复杂任务中同样有效，且可以大幅减少人工标注量和依赖于特定领域语料库的限制。使用多份蕴涵数据集来预训练模型是获得优异结果的关键。

May, 2022

THiFLY Research at SemEval-2023 Task 7: 基于 CTR 的文本蕴涵和证据检索的多粒度系统

本文介绍了一种基于多层次推理网络 (MGNet) 和 T5-based model SciFive 的多粒度文字蕴含和证据检索系统，并集成了模型集成和联合推理等方法，实现了在 NLI4CT 任务中的最佳表现。

Jun, 2023

用神经注意力推断

本文提出了一种新的神经模型，使用长短时记忆单元读取两个句子以确定蕴含关系，通过逐词的注意机制对每个单词和短语的蕴含进行推理，该模型在大型蕴含数据集上表现出了更好的性能，并且是第一个在文本蕴含数据集上实现最先进准确度的通用端到端可导系统。

Sep, 2015