Jul, 2021

领域匹配的密集检索预训练任务

TL;DR通过在 65 百万个合成问题和 2 亿个来自 Reddit 对话的帖子对大型 bi-encoder 模型进行适当的预训练,可以在信息检索和对话检索基准测试中实现比监督基准线显着更好的表现。