Dec, 2019

使用最难和半难负对挖掘的视觉 - 文本关联在人物搜索中的应用

TL;DR提出了一种采用视觉和文本注意力、交叉模态最难和半硬负对挖掘的新型视觉文本关联方法,通过在 CUHK-PEDES 数据集上的广泛实验,实现了 55.32% 的 top1 得分,成为了新的最先进方法。同时,在 COCO 字幕数据集上评估了半硬匹配挖掘方法,并验证了方法的有效性和互补性。