Aug, 2023

面向快速准确的图像文本检索与自监督细粒度对齐

TL;DR在这项工作中,我们在独立嵌入框架之上提出了一个图像-文本对齐模块SelfAlign,通过自监督对比学习在概念级和语境级强制进行图像-文本对齐,提高了检索准确性同时保持了检索效率。