ECCVAug, 2018

通过全局和本地图像 - 语言关联改进个体重新识别的深度视觉表示

TL;DR本研究提出了一种利用自然语言描述作为附加训练监督的方法来有效地学习视觉特征。通过建立全局和局部图像 - 语言关联来实现语义一致性,该方法不仅能够学习更好的全局视觉特征,还能够强制对局部视觉和语言特征进行语义一致性的限制,从而实现了对于特定个体较为紧凑和语义的描述。在实验中,我们证明了语言作为训练监督在两种关联方案下具有有效性,并且在不使用任何辅助信息的情况下实现了最新的技术性能,比其他图像 - 语言交互的联合嵌入方法表现更出色。