分治法用于依存关系感知的多跳证据检索
研究了在信息检索中识别文本蕴含问题的模型,使用了多种变量的神经网络模型,提出了基本的蕴含证据集成模型并展示了其有效性,同时引入了一个基准数据集并在其上进行了实验,并应用该模型于多选题答案排序任务达到了最新的研究效果。
May, 2016
通过引入 Multee, 一种能够有效使用预训练自然语言推理模型的通用结构,本文在 MultiRC 和 OpenBookQA 这两个多阶段问题回答的数据集上进行了实验。使用 NLI 预训练模型的 Multee 模型在性能上明显优于仅在目标数据集上进行训练的 QA 模型和 OpenAI 迁移学习模型。
Apr, 2019
本文提出了一种新的基于问题蕴含识别(Recognizing Question Entailment)的问答(Question Answering)方法,基于机器学习和深度学习算法,结合信息检索模型,在医疗领域实现了显著的问答准确率提升。
Jan, 2019
本文提出了一种新的基于阈值的语义文本表示方法,并结合机器学习算法应用语义和词汇特征对文本 - 假设对进行分类,该技术有效地丰富了文本的语义信息,在文字蕴涵分类任务中在意义理解方面的表现明显优于已知方法
Oct, 2022
本论文提出了一种多模态蕴含分类器来确定图像的语句,以及开发了一种通用可调节学习速率策略来教授一个检索模型区分这些蕴含的语句和其他负样本。在实验中,我们手动注释了一个蕴含更正的图像文本检索数据集用于评估。结果表明,所提出的蕴含分类器达到了约 78% 的准确度,并持续提高了图像文本检索基线的性能。
Aug, 2022
我们提出研究答案的蕴含关系,以识别更具信息量和更一般化的系统答案,从而更接近人类判断,无需学习。我们提出的蕴含关系评估可通过量化答案之间的推断差距来分配奖励或部分分数,实现对答案正确性的细致排序,其 AUC 比目前的方法更高。
May, 2024
本文介绍了一种信息检索技术,利用最初检索到的证据中存在的实体信息来学习到其他相关证据,并在超过 500 万个维基百科段落的语境下,取得了显着的检索性能提升。此外,检索到的证据还使得现有的 QA 模型(无需任何训练)在 Hotpot 基准测试中 F1 指标提升了 10.59 个点。
Sep, 2019
本文通过使用预训练推理模型,将事件论元抽取等 NLP 任务转化为文本蕴涵任务,证明了文本蕴涵模型在复杂任务中同样有效,且可以大幅减少人工标注量和依赖于特定领域语料库的限制。使用多份蕴涵数据集来预训练模型是获得优异结果的关键。
May, 2022
本文介绍了一种基于多层次推理网络 (MGNet) 和 T5-based model SciFive 的多粒度文字蕴含和证据检索系统,并集成了模型集成和联合推理等方法,实现了在 NLI4CT 任务中的最佳表现。
Jun, 2023
本文提出了一种新的神经模型,使用长短时记忆单元读取两个句子以确定蕴含关系,通过逐词的注意机制对每个单词和短语的蕴含进行推理,该模型在大型蕴含数据集上表现出了更好的性能,并且是第一个在文本蕴含数据集上实现最先进准确度的通用端到端可导系统。
Sep, 2015