关系诸如上位词:通过分布向量识别和利用海斯特模式以用于语义蕴涵
本论文介绍一种互补框架,该框架将基于模式的方法和分布式方法无缝协作,以检测单词之间的上位词关系,尤其是针对一些在基于模式的方法中无效的情况。在多个基准数据集上,我们的框架取得了竞争性的改进,并且案例研究显示它更具可解释性。
Oct, 2020
该研究提出了一种基于向量空间的框架来对词汇包容性建模的分布语义模型,利用伪短语中邻近的两个词向量提出了一种隐向量,并探究了模拟词作为证据或词作为后验分布的优缺点。实验表明,所得到的词嵌入模型优于之前预测词之间下义词关系的最佳结果。
Oct, 2017
本文研究了两种无监督上义词检测方法:基于模式和基于分布的方法。在多个上位词任务上,实验发现基于模式的方法在常见基准数据集上始终优于基于分布的方法。结果表明,基于模式的模型提供了尚未在基于分布的方法中捕获的重要语境约束。
Jun, 2018
本文提出了一种新方法, 结合了双曲嵌入与 Hearst 模式,用于从大型文本语料库中推断概念层次结构和 is-a 关系。实验表明,该方法在多个基准测试中取得了最先进的性能。
Feb, 2019
本文提出了一个基于向量空间的模型,通过平均场近似,发展了逼近推理程序和蕴涵操作,用于重新解释现有的分布式语义模型(Word2Vec),以近似预测词汇蕴涵关系,通过无监督和半监督实验,在下义词检测方面取得了显著的改进。
Jul, 2016
本研究提出了一种基于分布式方法和基于模式方法集成的弱监督关系提取模型,通过共同训练两个模块,实现在标记数据不足的情况下提高识别准确率的目的。在实验中,该模型成功完成了知识库补全和语料库级别关系提取任务。
Nov, 2017
该论文提出了一种新的后处理方法 LEAR(词汇蕴涵吸引 - 排斥),将任何输入的词向量空间转换为重视词汇蕴涵关系(LE)的不对称关系,通过将外部语言约束(例如 WordNet 链接)注入到初始向量空间中,LE 特化过程将真正的下位词 - 上位词对在转换后的欧几里得空间中靠近。同时,联合目标使用对称余弦距离来强制实施语义相似性,从而使向量空间同时专门用于词汇关系。LEAR 专业化模型在上位词方向性,上位词检测和分级词汇蕴涵任务中实现了最先进的性能,证明了所提出的不对称专业化模型的有效性和鲁棒性。
Oct, 2017
通过密集向量的近邻搜索,我们介绍了一种简单的方法,在测试时间通过训练关系来解决隐含表达和长尾关系类的问题,此方法在 REFinD 上实现了最先进的性能。
Oct, 2023
本文中,我们通过使用循环神经网络对依赖路径进行编码,提出了一种改进的基于路径的算法,可以有效检测 NLP 中的上下位关系,并且与分布式方法相当。 我们进一步将这种方法扩展到组合基于路径和分布式信号的方法,从而显着提高了检测上下位关系的准确性。
Mar, 2016