Feb, 2024

通过 LLM-Cognition 数据增强来概括对话式密集检索

TL;DR通过 LLM - 认知数据增强(ConvAug)的方式,本文提出了一个泛化会话密集检索的框架,生成多级增强会话以捕捉会话上下文的多样性,利用认知感知过程减少误报、漏报和幻觉,通过难度自适应的样本筛选改进模型的学习空间,采用对比学习目标训练更好的会话上下文编码器。通过在四个公共数据集上进行广泛实验,包括正常设置和零样本设置,证明了 ConvAug 的有效性、泛化性和适用性。