Sep, 2024
通过指令调优的无监督文本表示学习用于零-shot密集检索
Unsupervised Text Representation Learning via Instruction-Tuning for
Zero-Shot Dense Retrieval
TL;DR本研究解决了密集检索系统对标注数据的依赖问题,提出了一种通过指令调优的预训练编码器-解码器大语言模型进行无监督文本表示学习的新方法。研究表明,通过生成相关的合成查询,可以增强语料库表示,从而在低资源设置下显著改善零-shot检索性能。