Sep, 2022

Promptagator: 从8个示例实现少样本密集检索

TL;DR本文提出了基于大语言模型的Few-shot Dense Retrieval任务中Prompt-based Query Generation for Retriever (Promptagator)方法,利用少量任务单独的知识生成具有任务特定的检索器并使用LLM促进扩展性,与传统基于自然问题或MS MARCO的训练方式相比,使用8个或更少的样本提示LLM生成的双编码器可以显著提高检索性能达1.2个nDCG以上。