May, 2023

无需平行图像 - 文本数据的基于文本的人物搜索

TL;DR本文提出了一种基于生成 - 检索(GTR)框架的文本搜索人物图像方法(TBPS),其中通过细粒度图像字幕和噪声评分训练来生成人物图像的伪文本,实现了不需要并行图像 - 文本数据的高效搜索。实验表明,所提出的方法在多个 TBPS 基准(即 CUHK-PEDES、ICFG-PEDES 和 RSTPReid)上具有很好的性能。