May, 2023

ImSimCSE:从两个角度改进句子嵌入的对比学习

TL;DR本文从处理 dropout 噪声和解决特征损坏两个角度,提出了两种改进对比学习的方法,均能提高句子嵌入的性能,实验证明,将两种方法结合使用,相较于基于 BERT 基础的强基线模型 SimCSE,性能提升了 1.8 个点;同时,这些方法还能适用于 DiffCSE 等其他有着强鲁棒性的模型。