英语名词复合词表示方法的系统比较
论文介绍了一种利用多层次信息和分布式信息的新技术,以检测名词短语的组合度,同时采用有监督的方法,并且使用了 Poincaré 嵌入,可以获得显著的效果提升。
Jun, 2019
通过最大化同一文本最小扰动嵌入之间的对齐,以及在更广泛的语料库中鼓励嵌入的均匀分布,基于对比学习的各种方法已被提出来从未标记的数据中学习文本表示。不同的是,我们提出最大化文本和其短语成分组成之间的对齐,考虑了此目标的多种实现方法,并详细阐述了每种情况下对表示的影响。语义文本相似性任务上的实验结果显示,与最先进的方法相当的基线改进。此外,本工作是第一个这样做而不需要额外网络参数或辅助训练目标的工作。
Jul, 2023
在多项组合任务中,我们提供一项神经词表示和基于共现计数的传统向量空间之间的比较研究。在三个不同的语义空间中,我们实现了七个基于张量的组合模型,并在涉及动词消歧和句子相似性的任务中进行测试。在大规模任务中,神经词嵌入表现优越,表现稳定。
Aug, 2014
本研究详细介绍了一个基于丰富的单词嵌入的组成分布式框架,旨在促进句子中单词之间的交互,并使用环境中的句法信息来增强向量。研究结果表明,该框架在 MSRPar 任务上取得了具有代表性的结果。
Aug, 2015
该研究实现并比较了名词复合分析的各种统计方法。结果表明,使用概念联想不仅能够实现广泛覆盖,还能提高准确性。基于依赖语法的分析模型比基于最深成分的分析模型更准确,尽管后者在文献中更为普遍。
Apr, 1995
本文探索了一种替代方案,该方案涉及使用分布邻域明确推断未观察到的共现词,结果表明,分布推断在几个单词相似性基准测试中提高了稀疏的单词表示,并且我们的模型在可解释性的同时,在形容词 - 名词,名词 - 名词和动词 - 对象组合方面与最新技术保持竞争力。
Aug, 2016
本文介绍了基于矢量表示的分布语义模型,扩展到短语和句子,提出了分类组合分布语义学理论框架,实现了短语和句子层面的言外推理,并通过实验论证了基于密度矩阵的熵距离在词语和短语、句子层面的言外推理可行性和优越性。
Dec, 2015
本文介绍一种基于词嵌入组合方法,该方法旨在通过满足新向量与其组成部分的向量表示之间的距离一致且最小化来实现给定一组词的公平嵌入表示。该嵌入组合方法可适用于静态和上下文相关的词表示,适用于创建句子的表示,并学习不一定按序组织的词组的表示。我们理论上表征了这种表示存在的条件并推导了解决方案。我们在数据增强和句子分类任务中评估了该方法,研究了嵌入和组合方法的多种设计选择。我们展示了我们的方法在解决用于捕捉句子简单语言特征的探测任务方面的卓越效果。
Jun, 2024
本研究通过测试多种文本表示模型的性能,发现与静态词嵌入相比,上下文有关的单词表示模型对于检测含义转移等方面的应对能力更强,但在获取暗含信息方面,其表现仍远远不及人类水平。研究者设计的包含 5 个涉及词汇组合效应的任务的评估套件可用于提高此类表示模型的研究。
Feb, 2019
本文探讨了现代语言模型是否能够学会表示复合短语中的复合性和非复合性,通过预测长语的内部表示来证明了现代语言模型可以预测一个父短语的表示。同时,通过多种分析,揭示了不同类型的语言模型何时产生了复合表示,并探讨了未来建模工作的可能性。
Oct, 2022