SIGIRApr, 2022

使用 CharacterBERT 和自学习技术提高密集检索器对带有拼写错误查询的健壮性

TL;DR本文研究了密集型检索器在处理拼写错误查询时的问题,并提出了使用 CharacterBERT 作为骨干编码器和自我教学(ST)方法的密集型检索器,这样可以在具有拼写错误的查询上实现更高的效果。在此基础上,文章还提供了一个包含真实查询和相关性评估数据集,并在 https://github.com/facebookresearch/DPR 上公开了代码和实验结果。