SIGIRJun, 2022

利用增强的案例正例和检索负例改进句子嵌入的对比学习

TL;DR本文提出了一种新的文本对比学习方法 ——CARDS,改进了正负样本的质量问题,提出了一种 switch-case augmentation 方式来对抗预训练模型对频率、词形大小写和子词的内在偏态,同时从整个数据集中使用已预训练的语言模型来挖掘难负样本,结果表明该方法在无监督环境下显著优于现有的方法。