ACLMay, 2023

BERM: 训练平衡且可提取的匹配表示以提高密集检索的泛化能力

TL;DR本文介绍了一种通过捕获匹配信号来提高密集检索通用性的新方法 BERM,其中单篇文章分段成多个单元,根据单元级平衡语义和基本匹配单元可提取性的两个要求作为匹配信号的表示约束。实验结果表明,该方法可以有效地改善密集检索训练方法的普适性,而没有额外的推理开销和目标领域数据。