关系诸如上位词：通过分布向量识别和利用海斯特模式以用于语义蕴涵

EMNLPMay, 2016

关系诸如上位词：通过分布向量识别和利用海斯特模式以用于语义蕴涵

Relations such as Hypernymy: Identifying and Exploiting Hearst Patterns in Distributional Vectors for Lexical Entailment

PDF

Stephen Roller, Katrin Erk

TL;DR本文研究使用分布式向量预测词汇蕴涵的任务，提出基于 Hearst patterns 的特征提取方法，并结合文献中已有的优秀模型，成功预测多个数据集的结果。

Abstract

We consider the task of predicting lexical entailment using distributional vectors. We perform a novel qualitative analysis of one existing model which was previously shown to only measure the prototypicality of word pairs. We find that the model strongly learns to identify

lexical entailment distributional vectors hypernyms hearst patterns feature extraction

发现论文，激发创造

当 Hearst 不足以时：使用分布式模型改进基于语料库的上下位关系检测

本论文介绍一种互补框架，该框架将基于模式的方法和分布式方法无缝协作，以检测单词之间的上位词关系，尤其是针对一些在基于模式的方法中无效的情况。在多个基准数据集上，我们的框架取得了竞争性的改进，并且案例研究显示它更具可解释性。

Oct, 2020

利用蕴涵的分布式语义学学习上下位词的词嵌入

该研究提出了一种基于向量空间的框架来对词汇包容性建模的分布语义模型，利用伪短语中邻近的两个词向量提出了一种隐向量，并探究了模拟词作为证据或词作为后验分布的优缺点。实验表明，所得到的词嵌入模型优于之前预测词之间下义词关系的最佳结果。

Oct, 2017

Hearst 模式再探：基于大型文本语料库的自动上下位词检测

本文研究了两种无监督上义词检测方法：基于模式和基于分布的方法。在多个上位词任务上，实验发现基于模式的方法在常见基准数据集上始终优于基于分布的方法。结果表明，基于模式的模型提供了尚未在基于分布的方法中捕获的重要语境约束。

Jun, 2018

通过双曲嵌入从文本语料库中推导概念层次结构

本文提出了一种新方法，结合了双曲嵌入与 Hearst 模式，用于从大型文本语料库中推断概念层次结构和 is-a 关系。实验表明，该方法在多个基准测试中取得了最先进的性能。

Feb, 2019

基于路径和分布信息的词汇语义关系识别

本文介绍了一种综合神经方法以识别多个语义关系和判断上位词检测，结果表明基于路径的信息源对分类的贡献不可或缺且常常与分布式信息互补。

Aug, 2016

分布语义的向量空间用于蕴涵

本文提出了一个基于向量空间的模型，通过平均场近似，发展了逼近推理程序和蕴涵操作，用于重新解释现有的分布式语义模型（Word2Vec），以近似预测词汇蕴涵关系，通过无监督和半监督实验，在下义词检测方面取得了显著的改进。

Jul, 2016

基于模式增强嵌入学习的弱监督关系抽取

本研究提出了一种基于分布式方法和基于模式方法集成的弱监督关系提取模型，通过共同训练两个模块，实现在标记数据不足的情况下提高识别准确率的目的。在实验中，该模型成功完成了知识库补全和语料库级别关系提取任务。

Nov, 2017

为词汇蕴涵专门化的词向量

该论文提出了一种新的后处理方法 LEAR（词汇蕴涵吸引 - 排斥），将任何输入的词向量空间转换为重视词汇蕴涵关系（LE）的不对称关系，通过将外部语言约束（例如 WordNet 链接）注入到初始向量空间中，LE 特化过程将真正的下位词 - 上位词对在转换后的欧几里得空间中靠近。同时，联合目标使用对称余弦距离来强制实施语义相似性，从而使向量空间同时专门用于词汇关系。LEAR 专业化模型在上位词方向性，上位词检测和分级词汇蕴涵任务中实现了最先进的性能，证明了所提出的不对称专业化模型的有效性和鲁棒性。

Oct, 2017

基于向量化词汇 - 句法模式的金融文件关系抽取的最近邻搜索

通过密集向量的近邻搜索，我们介绍了一种简单的方法，在测试时间通过训练关系来解决隐含表达和长尾关系类的问题，此方法在 REFinD 上实现了最先进的性能。

Oct, 2023

整合基于路径和分布式方法的上下位词检测的改进

本文中，我们通过使用循环神经网络对依赖路径进行编码，提出了一种改进的基于路径的算法，可以有效检测 NLP 中的上下位关系，并且与分布式方法相当。我们进一步将这种方法扩展到组合基于路径和分布式信号的方法，从而显着提高了检测上下位关系的准确性。

Mar, 2016