AXOLOTL-24的深度变化:协同语义变化建模中的WSD和WSI模型
本文通过对词汇语义分歧的跨学科大规模评估,在时间尺度和领域范畴两方面开展语义感知变化的检测,并通过集成和扩展基准模型来解决评估历程中表面性和缺乏比较的挑战。此外,本文还展示了利用相同的评估方式和建模方法可以成功地应用于术语提取领域异构感知偏离的同步性检测。
Jun, 2019
本文介绍我们在SemEval2020任务1中创造性的提出了语义变化检测方法,该方法是全自动的,不需要人工干预,且独立于语言;我们利用标准相关分析和正交变换计算语义空间之间的线性变换,并通过比较早期和晚期语料库中目标单词的向量之间的余弦相似度来检测语义变化。
Nov, 2020
本文介绍了 DUKweb 数据库,它是一个大规模的资源集,用于对当代英语进行历时分析。该资源集可以提供每年的词共现矩阵和两种类型的词向量表示。我们通过一个词义变化检测的案例研究展示了 DUKweb 的重用潜力和质量标准。
Jul, 2021
本文研究使用基于上下文嵌入方法进行检测历时语义变化的可能存在的输出错误。通过引入单一方法并进行深入的分析,作者发现这种方法可能会将词汇的词典含义变化与上下文语境的变化混淆,同时将词汇实体的句法和语义方面合并在一起。本文提出了一些解决这些问题的未来可能方案。
Aug, 2022
该研究提出了一种基于图的聚类方法,旨在捕捉各种高频和低频单词感知的微妙变化,包括这些感知随时间的获得和丧失。实验结果表明,该方法在四种语言的SemEval2020二元分类任务中显著超过了以前的方法。此外,我们展示了该方法作为一种多功能可视化工具,在语言内部和语言之间设置中检测语义变化的能力。我们已公开提供代码和数据。
Feb, 2024
现有的LSC问题评估通常集中在Graded Change Detection (GCD)任务上,但由于它们依赖不同的设置,性能比较往往会误导。本研究在相同的条件下评估了最先进的GCD模型和方法,并将LSC问题分解为Word-in-Context (WiC)和Word Sense Induction (WSI)任务,在不同语言上对八个可用的LSC基准进行了比较,表明(i) APD在GCD方面优于其他方法;(ii) XL-LEXEME在WiC、WSI和GCD方面优于其他上下文化模型,与GPT-4相当;(iii) 需要明确改进词义建模以及关注词义变化的方式、时间和原因,而不仅仅关注语义变化的程度。
Feb, 2024
我们通过研究由词汇替换引入的意外上下文的影响,建模了语义变化,并提出了一种替换模式作为可解释的语义变化模型,同时还首次评估了使用 LLaMa 进行语义变化检测的方法。
Apr, 2024
我们在AXOLOTL-24共享任务中提交了我们的研究成果,共享任务包括两个子任务:识别单词随时间获得的新义项(在比较较新和较旧的时间段时)和为识别出的新义项提供定义。我们通过实现一个概念简单且计算成本低的解决方案来完成这两个子任务。我们训练了基于适配器的二分类模型,用于将词汇解释与用法示例匹配,并利用模型的概率输出来识别新义项。这些模型还用于将新义项的用法示例与Wiktionary的定义进行匹配。我们的提交在第一个子任务上获得第三名,在第二个子任务上获得第一名。
Jul, 2024
本论文描述了AXOLOTL'24组织和发现的第一次多语言可解释的语义变化建模共享任务。我们介绍了用于该共享任务的新的带有感知标注的芬兰语和俄语历时语义变化数据集,并从现有资源中借用了一份仅用于意外测试的德语数据集。AXOLOTL'24的设置在语义变化建模领域是新的,涉及对未知(新颖)语义的识别以及为这些语义提供类似词典的定义的子任务。论文描述和比较了获胜团队的方法,为历史意义变化的计算方法向可解释性铺平了道路。
Jul, 2024