语义变迁的计算建模
该论文评述了语义变化计算在计算语言学领域中的发展现状,提出了一个框架,总结了该领域的五个关键组成部分:历时语料库、历时词义表征、变化建模、评估数据和数据可视化,并指出了该领域存在的核心问题。
Jan, 2018
本章节介绍了在计算科学和语言学领域日益增长的兴趣中,对大规模历时文本数据建模和检测语义变化的主要方法,大多数方法都使用神经嵌入,虽然神经模型是易于建模历时文本的主要原因之一,但在解决问题的许多方面距离理想状态还有很远的路要走,该领域有着若干个开放和复杂的挑战。
Jan, 2021
自动语义变化方法旨在通过分析词语在历时语料库中的使用来识别其含义随时间的变化。本文分析了在真实的英语和罗马尼亚数据集上创建静态和上下文词嵌入模型(Word2Vec 和 ELMo)的不同策略。通过对英语数据集(SEMEVAL-CCOHA)进行评估,并针对罗马尼亚数据集进行实验来确定模型的性能,并突出该低资源语言中语义变化的不同方面,如含义的获取与丧失。实验结果表明,在选择模型和计算语义变化得分的距离方面,取决于语料库,这是最重要的因素。
Aug, 2023
本文研究使用基于上下文嵌入方法进行检测历时语义变化的可能存在的输出错误。通过引入单一方法并进行深入的分析,作者发现这种方法可能会将词汇的词典含义变化与上下文语境的变化混淆,同时将词汇实体的句法和语义方面合并在一起。本文提出了一些解决这些问题的未来可能方案。
Aug, 2022
我们提出了一种新颖的动态嵌入式主题模型和转折点检测的组合方法,用于探索古典与早期基督教拉丁语中词汇语义情态的历时变化。我们展示了几种方法来寻找和描述产出中的模式,并将其与比较文学和经典学中的传统学术研究联系起来。这种简单的无监督语义变化模型方法可以应用于任何合适的语料库,我们最后讨论了未来的方向和改进,以使噪声更大、经过整理较少的材料达到这个阈值。
Jan, 2024
我们通过研究由词汇替换引入的意外上下文的影响,建模了语义变化,并提出了一种替换模式作为可解释的语义变化模型,同时还首次评估了使用 LLaMa 进行语义变化检测的方法。
Apr, 2024
本文提出从变化检测到变化发现的新方向,重点在于发现全文词汇中的新单词含义变化。通过对最近发表的德语数据进行深度调整,研究人员证明了两种模型都可以成功地应用于发现正在经历含义变化的新单词。此外,还提供一个几乎全自动化的框架用于评估和发现。
Jun, 2021