Mar, 2024

MagicLens:自我监督图像检索与开放式指令

TL;DR利用文本指令和多模态模型实现自我监督图像检索,能够检索到具有丰富关系的图像,超过了先前最先进的方法,并且模型体积更小,同时支持多样的搜索意图。