ACLJul, 2022

利用释义研究上下文嵌入的特性

TL;DR通过使用释义作为数据源,我们分析了上下文嵌入,特别关注 BERT。由于释义自然地编码了一致的单词和短语语义,因此它们为研究嵌入的属性提供了独特的视角。我们发现上下文嵌入可以有效地处理多义词,但在许多情况下,在语义相似的情况下,给出了不同的同义词表示表现。我们证实了 BERT 对单词顺序的敏感性,但发现不同于以往的研究,BERT 的各层在上下文化程度方面存在稍微不同的模式。