ICCVAug, 2017

Deep Binaries: 对话 - 视觉跨检索中编码语义丰富线索的有效方法

TL;DR本文提出了一种名为文本视觉深度二进制编码(TVDB)的方法,该方法利用区域卷积网络和文本卷积网络来分别探索图像的区域细节和句子的语义线索,通过交替优化来高效地优化二进制编码和深层编码函数,实验证明此方法能够显著提高跨模态检索的性能。