通过评估 PPMI,SVD 和 word2vec 等词嵌入模型来量化语义变化的方法,我们提出并验证了语义演化的两个定量化规律:与频率呈反幂律相关的语义变化率规律和与多义性无关的语义变化率规律。
May, 2016
本研究同时使用静态和时变词嵌入来衡量事件对词汇的影响,通过创建历史转折点的时间轴来了解目标词的演化,定量评估结果表明这种技术可以捕捉语义变化和事件影响。
Sep, 2019
该研究提出了一种基于图的聚类方法,旨在捕捉各种高频和低频单词感知的微妙变化,包括这些感知随时间的获得和丧失。实验结果表明,该方法在四种语言的 SemEval2020 二元分类任务中显著超过了以前的方法。此外,我们展示了该方法作为一种多功能可视化工具,在语言内部和语言之间设置中检测语义变化的能力。我们已公开提供代码和数据。
Feb, 2024
本文综述了当前关于使用预测型词嵌入模型追踪词汇语义时序变化和语义漂移检测的学术研究现状,并讨论了该领域的挑战和应用前景。
Jun, 2018
分析语义变化的模式在长篇实际文本(如书籍或记录)中是有趣的,从文体、认知和语言的角度来看。这项研究也对应用领域,如文本分段、文档摘要和语义新颖性检测是有用的。本文通过时间序列的语义相似性以及多本文学作品的两两句子相似性矩阵比较了几种最近的句子嵌入方法。与以前使用目标任务和精心策划的数据集比较句子嵌入方法的研究不同,我们的方法提供了对方法在现实情境的评估。我们发现,大部分句子嵌入方法确实能够在给定文档中推断出高度相关的语义相似性模式,但也存在有趣的差异。
Aug, 2023
该研究通过发展一种动态统计模型学习时态感知的词向量表示,并实现了 “对齐问题” 的解决,从而可以可靠地捕捉时间上的语言演变,并在语义准确性和对齐质量方面持续优于现有的时间嵌入方法。
Mar, 2017
该研究提出了一种基于概率的语言模型,可以跟踪个别单词随时间的语义演变,并通过嵌入空间中的潜在轨迹表示单词和上下文。研究发现,该动态模型推断的单词嵌入轨迹更易解释,并且具有更高的预测性可能性。
Feb, 2017
本研究提出了一种为动态网络生成图层嵌入的新方法,包括构建多层图和使用改进的随机游走生成节点的时间上下文,再利用一个深度学习模型生成图层嵌入,并在公开数据集上进行了评估和比较。
Jun, 2023
本文讨论了跨语言句子嵌入向量表示句子语义的方法,并提出了通过简单的线性跨语言映射以及正交性偏差条件的度量来改善多语言嵌入向量。
May, 2023
该论文提出了一种用于动态图的时间感知变压器来嵌入顶点表示的方法,该方法使用时间边缘序列来维护异步结构演变,并在多个数据集上展示了其在图挖掘任务中的优越性能。
Jul, 2022