AAAINov, 2019

上下文词嵌入的逐步语义权重训练

TL;DR本研究提出一种新颖的在线算法,通过最小化上下文嵌入组内的距离来学习单词嵌入中每个维度的本质,以三种最先进的基于神经网络的语言模型 Flair、ELMo 和 BERT 生成上下文嵌入,为同一词汇类型生成不同的嵌入,这些嵌入由 SemCor 数据集手动标注的意义进行分组,结论表明本文提出的算法不会损伤性能,甚至能提高 3%,可以用于未来关于上下文嵌入可解释性的研究。