CVPRJul, 2018

利用共注意力对齐符号和物体以理解视觉广告

TL;DR本文提出了一种注意力机制下的嵌入模型,通过利用多模态表示来关联图像提议与符号并从中有效地汇集信息。我们应用多次多模态注意力机制来迭代改进注意力映射,从而提高精确度,并采用最大化边缘损失函数进行端到端学习,证明该模型在广告数据集上的效果优于其他基线模型。