超越词级别的释义、文本蕴涵和语义相似度

Aug, 2022

超越词级别的释义、文本蕴涵和语义相似度

Paraphrasing, textual entailment, and semantic similarity above word level

Venelin Kovatchev

TL;DR本论文研究语言和计算方面在短语、从句、句子和段落之间可能存在的意义关系，特别关注了近义词替换、文本蕴涵、矛盾和语义相似性，并探讨了量化语义相似度的不同方法，以及自动化的近义词识别。

Abstract

This dissertation explores the linguistic and computational aspects of the meaning relations that can hold between two or more complex linguistic

linguistic computational paraphrasing textual entailment semantic similarity

发现论文，激发创造

释义与文本蕴涵方法调查

文章总结了表述和文本蕴含两个领域的关键思想，包括识别、生成和提取方法，指出两个领域在自然语言处理应用方面的重要性。

Dec, 2009

超越词汇的分布式语义学：类比和释义的监督学习

本篇论文介绍了一种将分布式语义学从单个单词扩展到词对、短语和句子等的方法，通过使用组件词中的成对相似性来比较两个元组，从而实现关系相似性（类比）和组成相似性（释义）之间的转换，并通过监督学习生成组合函数。在衡量单词对之间的关系相似性（SAT 类比和 SemEval 2012 任务 2）和名词修饰短语和单个词之间的组成相似性方面取得了最优结果。

Oct, 2013

利用自然推理证明确定语义文本相似性

本文提出了一种通过将浅层特征和句子对之间的双向蕴涵关系的自然演绎证明的特征相结合的方法来确定语义文本相似度的方法，并使用 ccg2lambda 实现自动推理。实验表明，本方法能够超越其他逻辑方法，并且证明导出的特征对学习文本相似度很有效。

Jul, 2017

通过经验文本表示的语义特征实现文本蕴涵识别

本文提出了一种新的基于阈值的语义文本表示方法，并结合机器学习算法应用语义和词汇特征对文本 - 假设对进行分类，该技术有效地丰富了文本的语义信息，在文字蕴涵分类任务中在意义理解方面的表现明显优于已知方法

Oct, 2022

分治法用于依存关系感知的多跳证据检索

通过考虑多种相关性信号，我们将多跳问题回答的证据检索任务划分为两个子任务：语义文本相似度和推理相似度检索。我们提出了两种集成模型 EAR 和 EARnest，分别处理每个子任务，然后考虑不同的相关性信号对句子进行重新排序。在 HotpotQA 上的实验证明，我们的模型不仅显著优于基于单一检索模型，而且比两个直观的集成基准模型更有效。

Nov, 2023

风格转移和改写：寻找合理的语义相似性度量

本文分析了超过十余种测量两个短文本的语义相似性的方法，并使用一个新的标记为语义相似性的 14,000 句子数据集证明文献中使用的这些度量标准都不能够足够接近人的判断。虽然有一些最近提出的度量标准提供了具有可比性的结果，但 Word Mover Distance 被证明是目前测量改写文本的语义相似性的最合理的解决方案。

Apr, 2020

文本丰富化的密集复述

本文提出了 Dense Paraphrasing（DP）这一文本表征转化的过程，即通过对文本表达（词汇或词组）进行重写以减少歧义并使底层语义得到明确的阐述，从而改善推理和问答任务性能。同时，作者介绍了第一个完整的 DP 数据集及注释任务的范畴和设计，并通过实验取得了令人满意的结果。

Oct, 2022

利用自然推理证明获取短语对应关系

本研究提出一种通过语义关系自然推导证明来检测词组知识的方法，利用部分变量协同作图重构以及诱导意义呈现的子图对齐算法，可自动检测各种不存在于现有词组数据库的词组，进而提高了文本推理任务的准确率。

Apr, 2018

依赖项：为信息检索形式化语义链

本论文在语义处理方面做出重大贡献，提出了多种数学模型以及解决研究范式中存在问题的建议，从而大大提升了机器自动进行语义推理的复杂性和粒度。

Sep, 2017

任务导向的释义分析

通过文献综述和提出分类法，本研究对 25 个已知的改写（子）任务进行整理和组织。使用分类器识别给定改写实例适用的任务，发现已知改写语料库中特定任务实例的分布差异很大。这意味着在没有明确定义相应改写条件的情况下使用这些语料库会导致不可比较和误导性的结果。

Mar, 2024