Nov, 2023

VSCode:基于2D提示学习的通用视觉突显和伪装物体检测

TL;DR基于 VSCode 模型和 2D prompt 学习的引入,共同解决了四个显著目标检测任务和三个伪装目标检测任务,实现了在26个数据集上六个任务的最优结果,并通过结合2D prompts,如RGB-D COD,呈现了对未见任务的零样本泛化能力。