Jul, 2022

请求式视觉识别

TL;DR本文提出了一种新的视觉识别范式,名为 ViRReq,通过将视觉识别分解成命名为请求的原子任务,并利用知识库和语言驱动识别,在功不完备的数据集上学习复杂的整体 - 部分层次结构,并且能够轻松地插入新的概念。