Mar, 2023

冻结的预训练语言模型可用于实体中心问题的零 - shot 神经检索吗?

TL;DR本文提出了一种基于预训练语言模型的检索方法,通过利用领域中已有的实体信息来实现领域内检索。实验结果表明,在如 Wikipedia 等领域中,本文提出的检索方法在实体相关问题上的效果要优于传统的 DPR 方法,并且可以在不进行微调的情况下有效利用预训练语言模型的知识资源,从而在实体名称包含常用词的情况下表现出比 BM25 更好的性能。