Nov, 2023

视觉背景提示

TL;DR本文介绍了一种通用的视觉上下文提示框架,以支持涂鸦、方框和点等各种提示类型,并进一步改进以支持任意数量的上下文。通过在COCO和SA-1B上进行联合训练,我们的模型在COCO上达到57.7 PQ,在ADE20K上达到23.2 PQ。