Feb, 2024

基于最优传输的斯洛文尼亚语语义变化检测:一种新的数据集和方法

TL;DR我们研究斯洛文尼亚语(斯洛维尼亚语),这是一种资源较少的斯拉夫语言,探测语义变化,通过对社会和文化的变化,研究揭示语言的演变。我们提出了第一个斯洛文尼亚语数据集,用于评估语义变化检测系统,该数据集包含 104 个目标词的聚合语义变化分数,这些分数是从超过 3000 个手动注释的句子对中获得的。我们在该数据集上评估了几种现有的语义变化检测方法,并提出了一种基于最优输运的新方法,相比现有最先进系统,减少了 22.8% 的错误率。