本文通过概率定义新的释义来重新诠释 W2V 生成的词向量中的线性行为,证明了线性关系存在,并确定了差错项。
Jan, 2019
本文研究了连续词嵌入模型中用于衡量单词相似性的余弦相似度在正交变换下的稳定性,发现使用奇异值分解的正交变换可以提高某些成分的意义并使成分在重新学习时更稳定;同时对俄语语言模型(RusVectores、fastText、RDT)进行了组成分析。
Jul, 2017
通过使用矩阵表示实体和使用黎曼优化获得分块对角正交矩阵表示关系,我们引入了一种新颖的知识图谱嵌入模型 OrthogonalE,提高了模型的泛化性和灵活性,显著优于现有最先进的知识图谱嵌入模型,并大幅减少了关系参数的数量。
Jan, 2024
本研究提出了一种基于反射映射的词属性转移新方法,不需要进行类比操作,实验结果表明该方法可以在不改变不具有目标属性的单词的情况下转移给定单词的属性。
Jul, 2020
本文提出了一种新的基于转化距离的知识图谱链接预测方法,通过将 RotatE 从二维复杂域扩展到高维空间以及利用两个有向关系的上下文表示方法,有效地提高了难以预测的 N-1、1-N 和 N-N 情形的预测精度。实验结果表明,与基线 RotatE 相比,该方法在两个基准数据集上表现得更好,特别是在连接节点数量较高的数据集(FB15k-237)上。
Nov, 2019
本文介绍了一种基于 Grassmannian 的新方法,旨在通过建模单词集合所围成的子空间来捕获连续词向量表示中的类比关系,该方法利用测地核的修改余弦距离模型捕获跨单词类别的关系特定距离,实验结果表明与以前的方法相比,本方法在类比任务上表现显著改善。
Jul, 2015
本文评估了将平行四边形模型应用于现代单词嵌入的类比关系能够捕捉基于人类关系相似度判断的能力,并发现其在某些语义关系上表现更好,但同时提供了基于向量空间内在几何约束的更深层次局限性证据,对一阶相似性产生的古典结果进行类比。
May, 2017
本文介绍了一种新方法,神经网络词嵌入模型,以用于大规模文本分析,揭示了这些模型如何比以前的方法更能产生丰富的文化联想和类别,推进了一个与当代身份和文化理论一致的意义关系模型,以高维空间中的向量几何关系表示单词之间的语义关系。作者展示了词嵌入模型在宏观文化调查中的应用,并给出了对 20 世纪美国性别和阶级联系的纵向分析以及对美英性别和阶级标记历史区别的比较分析。作者认为,这些高维模型的成功促使朝着 “高维度理论化” 的意义、身份和文化过程的方向发展。
Mar, 2018
提出了一种名为 SpaceE 的翻译距离 (KGE) 基于线性变换的方法来模拟知识图谱中实体的关系,它可以很好地建模与非注射关系模式, 并且在许多具有非注射关系的数据集中明显优于现有的 KGE 方法。
Apr, 2022
本文提出了一种称为 RotatE 的新型知识图谱嵌入方法,它能够模拟和推断各种关系模式,包括对称性 / 反对称性、倒置和组合,并使用一种新颖的自对抗负采样技术有效地训练模型,实验证明它不仅可扩展性好,而且还能够显着地优于现有的最先进模型用于链接预测。
Feb, 2019