Jan, 2024

放弃您的解码器:使用词袋预测进行密集段落检索的预训练

TL;DR通过使用增强解码的遮蔽自动编码器预训练,显著提高了稠密表示中输入标记的术语覆盖,从而实现了在大规模检索基准上的最先进的检索性能,无需任何额外参数,相比于使用增强解码的标准遮蔽自动编码器预训练速度提高了 67%。