BriefGPT.xyz
May, 2019
基于替换的词义识别的改进
Towards better substitution-based word sense induction
HTML
PDF
Asaf Amrami, Yoav Goldberg
TL;DR
本文介绍了一种通过识别句中单词使用的不同含义进行分组的无监督词义归纳(WSI)任务。最近的工作使用了预先训练的RNN语言模型(ELMo)来进行聚类,并且将该方法适用于BERT进一步提高了得分。本文通过提出一种解释聚类结果的方法来扩展先前的方法支持动态而非固定数量的簇,并执行了广泛的错误分析来揭示WSI任务中剩余错误的来源。
Abstract
word sense induction
(WSI) is the task of unsupervised
clustering
of word usages within a sentence to distinguish senses. Recent work obtain strong results by
→