Jun, 2024

利用大型语言模型从大规模输出空间中提取间接知识的零 - shot 学习

TL;DR我们提出了一种通过大型语言模型(LLM)的反馈来训练一个小型双编码器模型的框架,该双编码器模型将文档和标签编码为用于检索的嵌入向量。我们的方法利用 LLM 的零样本能力来评估标签与文档之间的相关性,而不是使用从文档本身提取的低质量标签。我们的方法在各种数据集上表现优于现有技术,同时对于大型数据集具有相似的训练时间,且能保证快速推断。