Nov, 2023

ACID: 基于内容的抽象式文档检索标识符与语言模型

TL;DR通过生成式检索方法和使用大型语言模型生成抽象关键短语来构成文件的 ID,与现有的文档 ID 生成方法相比,我们的 ACID 方法在 MSMARCO 100k 检索任务和自然问题 100k 检索任务上分别使得前 10 和前 20 的准确率相对提高了 15.6%和 14.4%以及 4.4%和 4.0%。