Nov, 2023

视觉背景提示

TL;DR本文介绍了一种通用的视觉上下文提示框架,以支持涂鸦、方框和点等各种提示类型,并进一步改进以支持任意数量的上下文。通过在 COCO 和 SA-1B 上进行联合训练,我们的模型在 COCO 上达到 57.7 PQ,在 ADE20K 上达到 23.2 PQ。