Apr, 2023

跨模态信息检索是否可以无需训练?

TL;DR本文提出了一种基于深度学习预训练模型的编码表示方法,使用简单的最小二乘和奇异值分解(SVD)解决 Procrustes 问题来构建不同模态之间的语义对齐,并通过对预训练模型进行反证学习和多层感知机改进,实现了在图像和文本交叉检索任务中可比拟于需要昂贵的神经网络训练和微调的高性能。