Jun, 2024

LAIP: 从图像短语建模中学习本地对齐以用于基于文本的人物搜索

TL;DR本篇论文提出了基于图像 - 短语建模的本地对齐(LAIP)框架,其中包括双向注意力加权本地对齐(BidirAtt)和掩码短语建模(MPM)模块。实验证明,LAIP 框架在 CUHK-PEDES、ICFG-PEDES 和 RSTPReid 数据集上相比于现有方法具有更好的性能。