Feb, 2021

简约胜于繁华:利用弱解码器对强文本编码器进行预训练以进行密集检索

TL;DR本文提出一种基于自学习方法的预训练自编码语言模型,该模型通过训练编码器输出高质量的文本序列嵌入来解决解码器可能利用语言模式的问题,实验结果表明该模型能够显著提高稠密检索模型的效果和少样本学习能力。