Jun, 2023

基于条件 MLM 对比学习的句子嵌入方法 (CMLM-CSE)

TL;DR提出了一种基于条件 MLM 的无监督对比学习框架 CMLM-CSE,通过增加辅助网络来集成句子嵌入执行 MLM 任务,使句子嵌入学习更多的屏蔽词信息,使用 Bertbase 和 Robertabase 作为预训练语言模型进行预训练,在文本相似性任务中分别超过了 SimCSE 0.55 和 0.3 个百分点。