CVPRMar, 2023

通用实例感知作为物体发现和检索

TL;DR本文提出了一个称之为 UNINEXT 的通用实例感知模型,它将各种实例感知任务重新制定为统一的对象发现和检索范式,并且可以灵活地通过更改输入提示来感知不同类型的对象。这个统一的公式带来了以下好处:(1) 可以利用来自不同任务和标签词汇的大量数据进行联合训练,这对于缺乏训练数据的任务尤其有益。(2) 这个统一的模型是参数高效的,能够在处理多个任务时节省冗余计算。在 20 个具有挑战性的基准测试中,包括经典的图像级任务 (对象检测和实例分割)、视觉语言任务 (指称理解和分割) 和六个视频级对象跟踪任务,UNINEXT 表现出优异的性能。