May, 2019

基于替换的词义识别的改进

TL;DR本文介绍了一种通过识别句中单词使用的不同含义进行分组的无监督词义归纳(WSI)任务。最近的工作使用了预先训练的RNN语言模型(ELMo)来进行聚类,并且将该方法适用于BERT进一步提高了得分。本文通过提出一种解释聚类结果的方法来扩展先前的方法支持动态而非固定数量的簇,并执行了广泛的错误分析来揭示WSI任务中剩余错误的来源。