Nov, 2023

VGSG: 基于视觉引导的文本人物检索的语义组网络

TL;DR通过提出一种视觉引导的语义组网络 (VGSG),本文针对基于文本的人物搜索 (TBPS) 问题,在引导的视觉线索下提取了对齐良好的细粒度视觉和文本特征,并设计了一种关系性知识传递方法来适应地传播信息从而在无需外部工具和复杂配对交互的情况下将语义组文本特征与相应的视觉特征进行对齐,该方法在两个具有挑战性的基准测试中展现了优越性。