MMAug, 2023

面向快速准确的图像文本检索与自监督细粒度对齐

TL;DR在这项工作中,我们在独立嵌入框架之上提出了一个图像 - 文本对齐模块 SelfAlign,通过自监督对比学习在概念级和语境级强制进行图像 - 文本对齐,提高了检索准确性同时保持了检索效率。