AAAISep, 2018

基于姿态引导的多粒度注意力网络用于基于文本的人物搜索

TL;DR该研究提出了一种基于文本描述搜索人物图像的方法,通过使用多层次的视觉内容对不同语义相关性的相关图像和描述进行匹配,其中包括了多粒度的视觉信息。在 CUHK-PEDES 数据集上进行的实验表明,该方法在 top-1 指标上比现有方法高出 15%。