Oct, 2022

探寻嵌入的纹理: 探讨嵌入的构造

TL;DR通过引入噪音亚百特信息编码的向量空间,使用探测框架扩展方法,研究了GloVe和BERT嵌入中向量范数如何编码不同种类的信息,发现GloVe在向量范数中存储了句法和句子长度信息,而BERT则将其用于编码上下文不连贯信息。