Jun, 2022

视觉任务的统一序列接口

TL;DR本文提出一种基于共享像素到序列接口的框架,将计算机视觉中的四种不同任务(对象检测、实例分割、关键点检测和图像字幕)的输出形式都改为序列输出,并且可以通过短提示来实现任务特定的输出,证明可以用单个模型架构和损失函数在这些任务上进行训练,达到与传统模型相似的性能表现。