神经符号飞镖游戏下的词义消歧

Jul, 2023

Word Sense Disambiguation as a Game of Neurosymbolic Darts

Tiansi Dong, Rafet Sifa

TL;DR通过神经符号方法在嵌入式感知球的配置和逻辑推理中使得词义消岐的 F1 分数达到 90% 以上，从而突破了利用深度学习方法对词义消岐的准确度的层限。

Abstract

word sense disambiguation (WSD) is one of the hardest tasks in natural language understanding and knowledge engineering. The glass ceiling of 80% F1 score is recently achieved through supervised deep-learning, enriched by a variety of →

word sense disambiguation neurosymbolic methodology f1 score knowledge graphs sense embedding

发现论文，激发创造

基于知识的词义消歧的语义专业化

本文提出了一种基于词汇知识的语境化嵌入模型用于词义消岐，将相关语义的词义和上下文靠近，将不相关的远离，用 Attract-Repel 目标函数和自训练目标函数对嵌入进行调整，实现了在知识为基础的词义消岐方面的最新前沿成果。

Apr, 2023

非参数少样本学习用于词义消歧

本文提出了一种基于 MetricWSD 的非参数的少样本学习方法，通过进行情节性训练，并学习计算给定单词的不同意义之间的距离，将高频词的学习度量空间转移到低频的单词中，从而避免了在自然语言处理中监督式全单词 WSD 的一个重要挑战中的数据不平衡问题。该方法在不依赖任何词汇资源的情况下，能够获得强大的性能，并通过联合 WSD 评估基准实现了 75.1 F1 得分的良好表现。

Apr, 2021

统一语义表示的多语言词义消歧

本文提出了一种基于多语言词典建立知识和监督为基础的多语言词义消歧（MWSD）系统的方法，利用统一的语义表示，将多种语言的注释进行共同训练以解决 MWSD 的注释稀缺问题，并在 SemEval-13 和 SemEval-15 数据集上展示了该方法的有效性。

Oct, 2022

使用仅词嵌入的方法对 158 种语言进行词义消歧

本研究提出了一种基于预训练的词嵌入，利用完全无监督和无基于知识的方法诱导一个完整的词义库，并实现对 158 种语言中的单词进行上下文消歧，对于资源匮乏的语言特别有用。

Mar, 2020

使用主题模型的基于知识的词义消歧

本研究使用主题模型的形式设计了一种词义消歧系统，使其在上下文单词数线性增长的情况下扩展，该方法在 5 个英语全单词 WSD 数据集上进行的评估表明，其性能优于这一领域的当前最先进无监督知识为基础的 WSD 系统。

Jan, 2018

将弱监督的词义消歧集成到神经机器翻译中

本研究探讨了利用词义消歧算法扩大上下文范围提高神经机器翻译的效果，通过引入三种自适应聚类算法进行了验证并在 SemEval 数据上进行了评估，随后在一个最先进的 NMT 系统中联合学习单词向量和最佳 WSD 算法定义的词义向量，最终证明这种方法可以优于几个基准模型。

Oct, 2018

连点成线：通过对齐词义库桥接单词和定义之间的语义关系

本研究提出了一种采用词义从不同词义库中匹配相同词义的定义句子（术语）的光泽对齐算法，并使用这些对齐的库训练模型以确定目标单词在上下文中的语义等效性，解决了有限的训练数据和集中于 WordNet 等预定义的词义库的问题；实验结果表明，所提出的方法改善了所有词义和低频词义的预测，并优于现有工作。

Oct, 2021

词义归纳技术的现状：一种面向资源匮乏语言的词义消歧方法

这篇论文是关于如何运用词义感知诱导方法在缺乏词汇资源的语言中初始开展词义消岐研究，并提出了一些有趣的研究重点。

Oct, 2013

一种二次 0-1 规划方法用于词义消岐

本文介绍了一种基于 QIP 模型的词义消歧方法，通过最大化目标函数中词义 - 单词相似性和词义 - 词义关联性来捕获目标词不同词义间的互动，以解决词义相互依赖导致的组合优化问题。

Jan, 2022

使用 Gloss 消歧信息的双编码器向词义消歧的长尾延伸

本研究提出了一种基于双编码器模型的词义消歧方法，通过将目标词与其上下文以及每个意义所对应的词典定义进行独立编码后，将两部分编码器在相同的表示空间中联合优化，从而实现通过寻找最相似的意义编码来进行词义消歧。结果表明，该模型在英语全词 WSD 任务上表现出色，尤其在对稀有义项的处理上取得了明显提高，使得其在少见义项上的失误率降低了 31.1%。这证明了通过建模稀有义项的定义可以更有效地进行词义消歧。

May, 2020