Apr, 2021

WhiteningBERT:一种简单的无监督句子嵌入方法

TL;DR本研究对四种预训练模型进行了大量实验研究,并得出三个主要发现:平均所有令牌比仅使用 [CLS] 向量更好;同时使用顶部和底部层优于仅使用顶部层;基于简单白化的向量标准化策略能够成倍提高性能。