Aug, 2023

多模态梯度注意力学习用于可解释的组合图像检索

TL;DR我们提出了一种基于梯度注意的学习目标,用于解决组合图像检索问题。通过引入新的注意力计算技术和学习目标,我们展示了对图像区域进行更准确的定位和改进,并通过标准基准数据集显示了更好的可解释性和竞争性的定量检索性能。