May, 2023
使用双重多模式编码器对合成图像检索进行候选集重新排序
Candidate Set Re-ranking for Composed Image Retrieval with Dual Multi-modal Encoder
Zheyuan Liu, Weixuan Sun, Damien Teney, Stephen Gould
TL;DR该研究提出了一个两阶段模型:第一阶段使用常规向量距离度量,快速对候选项进行修剪;第二阶段采用双编码器体系结构,对参考文本 - 候选项 - 文本进行有效注视和重新排序,利用视觉和语言预训练网络,实现了组合先前方法的优点。