Jul, 2021

领域匹配的密集检索预训练任务

TL;DR通过在65百万个合成问题和2亿个来自Reddit对话的帖子对大型bi-encoder模型进行适当的预训练,可以在信息检索和对话检索基准测试中实现比监督基准线显着更好的表现。