Apr, 2024

半监督文本式人物搜索

TL;DR基于图像标注数据有限的半监督框架下,该论文提出了一个两阶段的基本解决方案,其中生成阶段利用图像字幕模型为未标注图片生成伪文本,检索阶段则使用增广数据进行完全监督的检索学习。而引入了噪声干扰的伪文本的框架,则提出了一个增强检索模型处理噪声数据能力的噪声鲁棒检索框架。该框架结合了混合 Patch-Channel 掩蔽和噪声引导渐进式训练两个关键策略,以防止过度拟合噪声监督,并根据伪文本的噪声水平引入渐进式训练进程。在多个 TBPS 基准测试上的广泛实验表明,该框架在半监督设置下取得了可观的性能。