ACLMay, 2020

使用 Gloss 消歧信息的双编码器向词义消歧的长尾延伸

TL;DR本研究提出了一种基于双编码器模型的词义消歧方法,通过将目标词与其上下文以及每个意义所对应的词典定义进行独立编码后,将两部分编码器在相同的表示空间中联合优化,从而实现通过寻找最相似的意义编码来进行词义消歧。结果表明,该模型在英语全词 WSD 任务上表现出色,尤其在对稀有义项的处理上取得了明显提高,使得其在少见义项上的失误率降低了 31.1%。这证明了通过建模稀有义项的定义可以更有效地进行词义消歧。