评估向量空间类比模型
研究发现,使用向量算术操作可以解决单词类比问题,本文提供了 skip-gram 模型中算术运算符对应的非线性嵌入模型的正式解释,证明了线性子结构存在于向量空间中,通过从技术上的角度证明了降低高频词权重的有效性以及欧氏距离在捕捉单词不相似性问题上的信息论解释。
Oct, 2018
本文通过分解和实证分析经典算数词类比测试,提出了两种新的指标,用于解决标准测试存在的问题,并区分广泛类别内二元词汇之间的相似方向和正确匹配词对之间存在常规变换的配对一致性;结果表明,尽管标准的词类比测试存在缺陷,但一些受欢迎的词嵌入方法仍然编码语言规律。
Oct, 2020
本文介绍了一种基于 Grassmannian 的新方法,旨在通过建模单词集合所围成的子空间来捕获连续词向量表示中的类比关系,该方法利用测地核的修改余弦距离模型捕获跨单词类别的关系特定距离,实验结果表明与以前的方法相比,本方法在类比任务上表现显著改善。
Jul, 2015
论文提出” 基于向量空间模型(VSM)的无标注文本学习算法 “,应用于中学生常见 SAT 考试的语义类比题及名词修饰语语义关系分类中,取得了 47% 和 43.2% 的正确率,性能达到当时最高水平。
Aug, 2005
这篇论文通过引入变分自动编码器 (VAE) 来解决通过向量算术处理的视觉类比推理问题,并且在 Abstraction and Reasoning Corpus (ARC) 中取得了有希望的结果。
Nov, 2023
本文介绍了一种测量关联相似性的方法 —— 潜在关联分析(LRA),该方法在信息提取、词义消岐和信息检索等领域具有潜在应用价值,并且与人类平均水平相当地达到了 374 个类比问题的 56% 的得分,同时,在语义关系分类的问题上,LRA 较 VSM 也取得了相似的增益。
Aug, 2006
通过学习较简单的 “问题模式” 结构表示,并结合众包和递归神经网络从产品描述中提取目的和机制向量表示,使我们在寻找类比时可以比传统信息检索方法获得更高的精确度和召回率,在创意发想实验中,模型检索的类比与传统方法相比, 显著提高了人们产生创造性想法的可能性,这一结果表明,在许多大规模的现实生活情境下,学习和利用较弱的结构表示是实现计算类比的一种很有前途的方法。
Jun, 2017