基于替换的词义识别的改进

May, 2019

Towards better substitution-based word sense induction

Asaf Amrami, Yoav Goldberg

TL;DR本文介绍了一种通过识别句中单词使用的不同含义进行分组的无监督词义归纳（WSI）任务。最近的工作使用了预先训练的RNN语言模型（ELMo）来进行聚类，并且将该方法适用于BERT进一步提高了得分。本文通过提出一种解释聚类结果的方法来扩展先前的方法支持动态而非固定数量的簇，并执行了广泛的错误分析来揭示WSI任务中剩余错误的来源。

Abstract

word sense induction (WSI) is the task of unsupervised clustering of word usages within a sentence to distinguish senses. Recent work obtain strong results by →