May, 2024

DEMO:高效的图像文本匹配的统计视角

TL;DRDEMO 是一种用于高效图像 - 文本匹配的新型哈希方法,通过使用多个扩增视角来刻画每个图像,并通过非参数分布差异度量确保稳健且精准的相似性结构,同时引入协作一致性学习来在 Hamming 空间中保持相似性结构、鼓励不同方向的检索分布的一致性,并通过在三个基准图像 - 文本匹配数据集上的广泛实验验证 DEMO 相较于多种最先进方法具有卓越性能。