ACLJun, 2019

文本 - 图像匹配的强大且稳健的基准线

TL;DR本文提出在文本图像匹配中使用新的训练和推导技术,首先通过实验证明了 sum loss 和 max-margin loss 存在的限制,提出了一种新的 kNN-margin loss。其次,在推导时提出一种 Inverted Softmax 和 Cross-modal Local Scaling 的技术,以减轻高维嵌入空间中的 hubness 问题,有效提升了所有指标的表现和得分。