Nov, 2023

UniIR: 训练和基准测试通用多模态信息检索器

TL;DR对于信息检索 (IR) 模型通常假设为同质化格式,限制了其适用于各种用户需求,如使用文本描述搜索图片,使用标题图搜索新闻文章或使用查询图搜索相似照片。为了满足这种不同的信息需求,我们引入了 UniIR,一种统一的指令引导多模态检索器,可以处理八个不同的跨模态检索任务。UniIR 是一个单一的检索系统,同时在十个不同的多模态 - IR 数据集上进行训练,解释用户指令来执行各种检索任务,展示了对现有数据集的鲁棒性能以及对新任务的零 - shot 泛化能力。我们的实验突出了多任务训练和指令调整是 UniIR 泛化能力的关键。此外,我们构建了 M-BEIR,一个综合结果的多模态检索基准,用于标准化通用多模态信息检索的评估。