Sep, 2022

Promptagator: 从 8 个示例实现少样本密集检索

TL;DR本文提出了基于大语言模型的 Few-shot Dense Retrieval 任务中 Prompt-based Query Generation for Retriever (Promptagator) 方法,利用少量任务单独的知识生成具有任务特定的检索器并使用 LLM 促进扩展性,与传统基于自然问题或 MS MARCO 的训练方式相比,使用 8 个或更少的样本提示 LLM 生成的双编码器可以显著提高检索性能达 1.2 个 nDCG 以上。