May, 2024

使用大型语言模型的基于文本的人员检索的数据增强

TL;DR该论文提出了基于大型语言模型的数据增强方法(LLM-DA)以提升文本检索模型在人物图像检索中的性能。LLM-DA 使用大型语言模型重写当前的文本数据集,通过增加词汇和句子结构的多样性来扩展数据集,同时保持原始关键概念和语义信息。为了抑制大型语言模型的幻觉,LLM-DA 引入了文本忠实度过滤器(TFF)来筛除不忠实的重写文本。为了平衡原始文本和扩增文本的贡献,提出了一种平衡采样策略(BSS)。实验结果表明,LLM-DA 能够提升当前文本检索模型在人物图像检索任务上的性能。