该研究提出了一种基于向量空间的框架来对词汇包容性建模的分布语义模型,利用伪短语中邻近的两个词向量提出了一种隐向量,并探究了模拟词作为证据或词作为后验分布的优缺点。实验表明,所得到的词嵌入模型优于之前预测词之间下义词关系的最佳结果。
Oct, 2017
介绍了一种名为 HyperVec 的神经模型,其可以学习分层嵌入,以检测和定向上位词,可以捕捉上位词 - 下位词分布层次结构,以及可以用于跨语言映射。实验结果表明,HyperVec 在上位词检测和定向,以及预测分级词汇蕴涵方面均优于现有的无监督方法和嵌入模型。
Jul, 2017
本文介绍了一个为参与 SemEval-2018 任务 9 的超超级词发现系统,通过预设的词汇表的搜索空间给出最佳的候选超系词。我们引入了神经网络架构来完成这个任务,并且实证研究了各种神经网络模型以建立单词和短语的潜在空间表示。评估模型包括卷积神经网络、长短期记忆网络、门控循环单元和循环卷积神经网络。我们还探讨了不同的嵌入方法,包括单词嵌入和感性嵌入,以取得更好的性能。
May, 2018
通过神经网络提出了一种新颖的完全可微的超盒子分类框架,能够以端到端的方式高效地训练超盒子模型,并取得显著降低的训练时间和卓越的分类结果。
Jul, 2023
在这篇文章中,我们提出了一种名为 TaxBox 的新框架,该框架使用盒状嵌入将 Taxonomy 概念映射到空间,并利用两个概率评分器处理概念附加和插入,从而避免伪叶片,实验结果表明,TaxBox 在四个真实数据集上的表现优于基线方法,并在一定程度上超过了先前的最优方法。
May, 2023
通过深度度量学习进行后处理可以提高神经语言模型中语义相似度推断的效果,并将层次拟合用于建模 IS-A 层次中的语义相似性细微差别。
Oct, 2022
本文研究使用盒子嵌入(box embeddings)模型来更好地捕捉细粒度实体类型之间的复杂相互依存关系,并与矢量嵌入模型进行比较,在几个实体类型基准测试中表现出最先进的性能和更好的预测一致性和置信度。
Jan, 2021
本文介绍了一种基于分布式向量嵌入 (DIVE) 的无监督学习方法用于上位词发现,通过每个词的非负向量嵌入来保留单词上下文的包含性质,该方法比以往的无监督嵌入提供最多两倍的准确性和最高的平均性能,并使用更紧凑的单词表示形式,产生许多新的最先进的结果。
本研究旨在探讨 NLP 中的 hypernymy detection 问题,提出两种数据扩增技术和两种扩增数据集的策略,通过对 3 种数据集和 2 种向量空间的评估表明,这些方法显著提高了分类器的性能。
May, 2020
BoxE 是一个新的嵌入模型,它可以同时解决目前模型存在的不表达、不支持显著推理模式、不支持高阶关系和不支持逻辑规则等限制性因素。 BoxE 成功地对许多所需的逻辑属性进行了自然编码,并表现出了最先进的性能。
Jul, 2020