一种确定性的桥接指代消解算法
通过探索名词短语的句法结构,我们创建了一个名为 embeddings_PP 的新的单词嵌入模型。使用该模型使得凌驾于 ISNotes 语料库上的关联性替代了语义相似性,实现了 30% 的桥接代词解决精度,并在桥接前置词选择中获得了超过最先进系统(Hou 等,2013 年)的实质性提升。
Mar, 2018
该研究将连贯指代消解视为基于上下文的问答,并提出了一个名为 BARQA 的框架来处理此任务,利用迁移学习的能力使模型在 ISNotes 和 BASHI 两个连贯语料库上的表现达到了最新的最佳水平。
Apr, 2020
本文提出了一种集成方法,通过将 GloVe 和 word2vec 的嵌入方式与语义网络 ConceptNet 和 PPDB 的结构化知识相结合,将它们的信息融合成一个具有大型多语言词汇的共同表示,并达到了许多词语相似性评估的最先进性能
Apr, 2016
本文提出一种方法学习语言的词汇,并使用图嵌入技术和跨语言向量空间映射方法结合本体源和语料库来提高现有词向量的覆盖范围以及加强其词汇知识。所提出的方法在 Rare Word Similarity dataset 上表现出 10% 的性能提升。
Jul, 2017
论文介绍了一种利用多层次信息和分布式信息的新技术,以检测名词短语的组合度,同时采用有监督的方法,并且使用了 Poincaré 嵌入,可以获得显著的效果提升。
Jun, 2019
提出了一种新的神经语言模型,它不仅包含单词顺序,还包括字符顺序,并利用 skip-gram 网络实现了高效的并行训练,从而在语义和句法类比任务中取得了 85.8%的高分。
Jun, 2015
本文介绍一种从无序平面嵌入空间中捕捉层次结构信息的数据结构算法,基于权威性分布的想法构建有向根树,用于识别单词的上位词关系和寻找共同祖先,同时在维基页面链接恢复方面表现出优异的性能。
Nov, 2022
使用 LSTM-Siamese 网络提出一种提高抽象代词分析性能的注重排名的模型,通过生成人工抽象代词句子 - 先行短语对来克服缺乏训练数据的问题。在 shell 名词分辨率上,我们的模型优于最先进的结果。在包含更多名词和代词的抽象指称子集的 ARRAU 语料库中,我们发现可以优化模型的变体,但在代词指称方面仍然落后。
Jun, 2017
本文提出了一种基于 delta-hyperbolicity 的方法,在超球面的笛卡尔积空间中嵌入词嵌入向量,在此基础上利用 Glove 算法学习无监督的词嵌入,并发现了这种嵌入方式相对于高斯词嵌入的几何意义,同时通过这种新类型几何的平行传送得出新的解决 word analogy 的方法,在各种任务上表现出色。
Oct, 2018