May, 2023

Ditto: 一种简单高效改善句向量表示的方法

TL;DR该研究提出了一种名为 Diagonal Attention Pooling (Ditto) 的无监督方法来解决 BERT 等预训练语言模型中句子表示的各向异性问题,通过基于模型的重要性估计对单词进行加权,改进了语义文本相似度 (STS) 任务的性能。