利用意义而非词汇来追踪话题

Jan, 2023

Using meaning instead of words to track topics

Judicael Poumay, Ashwin Ittoo

TL;DR本研究探讨了使用词嵌入的语义信息进行话题追踪的方法可行性。结果表明，这种语义方法与基于词汇的方法相当，但会出现不同的错误，两种方法可能互补。

Abstract

The ability to monitor the evolution of topics over time is extremely valuable for businesses. Currently, all existing topic tracking methods use lexical information by matching word usage. However, no studies has ever experimented with the use of →

topic tracking semantic information word embeddings lexical approach complementarity

发现论文，激发创造

历时词向量和语义漂移：一项调查

本文综述了当前关于使用预测型词嵌入模型追踪词汇语义时序变化和语义漂移检测的学术研究现状，并讨论了该领域的挑战和应用前景。

Jun, 2018

使用 Word2Vec 进行话题的时间分析

本研究提出了一种新的方法来检测和可视化主题的趋势，其中使用 k-means 聚类和余弦相似性模型来确定主题的移动路径与方向，并在各种媒体机构的文章数据集上进行了测试。

Sep, 2022

查询建议的关键词嵌入

本文提出了两种新颖的模型来进行关键字建议任务，使用 Word2Vec 和 FastText 的架构，通过利用文档中的关键字共现来生成关键字嵌入向量，并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外，还提供了基于排名的评估方法，对所提出的模型进行评估，并在已知项目和自由搜索场景下显示了较大的性能改进。

Jan, 2023

评估语义变化的句子嵌入模型的比较研究

分析语义变化的模式在长篇实际文本（如书籍或记录）中是有趣的，从文体、认知和语言的角度来看。这项研究也对应用领域，如文本分段、文档摘要和语义新颖性检测是有用的。本文通过时间序列的语义相似性以及多本文学作品的两两句子相似性矩阵比较了几种最近的句子嵌入方法。与以前使用目标任务和精心策划的数据集比较句子嵌入方法的研究不同，我们的方法提供了对方法在现实情境的评估。我们发现，大部分句子嵌入方法确实能够在给定文档中推断出高度相关的语义相似性模式，但也存在有趣的差异。

Aug, 2023

在词使用中捕获进化：只需增加更多聚类吗？

本文旨在研究语义演变在文本数据中的检测与分析方法，特别是基于上下文嵌入的新方法，通过对比多个方法的表现以及提出相关改进策略，显著提高了现有方法的性能。

Jan, 2020

现有词嵌入方法的全面实证评估

本文通过对现有单词嵌入方法的特点和分类任务的分析，将单词嵌入方法划分为传统方法和基于神经网络的方法，揭示基于神经网络的单词表示方法相比于传统方法更能捕捉语言的语义和句法规律。实验验证了不同方法的性能差异。

Mar, 2023

使用上下文化的单词表示来分析词汇语义的变化

本文提出了第一种使用上下文词表示进行无监督词汇语义变化的方法。利用 BERT 神经语言模型来获取单词用法的表示，将这些表示聚类到用法类型，并用三种提出的度量方式衡量关于时间的变化。创造了一个新的评估数据集，并表明模型表示和检测到的语义转移与人类判断之间呈正相关。 extensive 的定性分析表明，我们的方法捕捉了各种同步和历时语言现象。我们期望我们的工作将激发进一步的研究。

Apr, 2020

基于代替的语义变化检测使用上下文嵌入

使用上下文嵌入测量语义变化的简化方法，仅依赖于最可能替代被遮盖术语的方法，不仅这种方法可直接解释，而且在存储效率、性能及变化细致调查方面均表现优越。

Sep, 2023

联合学习词嵌入和潜在主题

该研究提出了一个名为 STE 的框架，可以以统一的方式学习词嵌入和潜在主题，从而解决多义问题，并在有效且高效的方式下生成有用的主题特定的词嵌入和连贯的潜在主题。

Jun, 2017

语义投影：从词嵌入中恢复多个不同物体特征的人类知识

该研究探讨了一种计算模型，即词嵌入模型，通过将词表示为多维空间中的向量，从词汇共现模式中学习来自语义记忆中的常见知识，并提出了语义投影的解决方案，以检验词嵌入模型是否能够恢复多种语义特征和对象属性的上下文依赖关系。

Feb, 2018