Apr, 2022

X-DETR:一种用于实例级视觉 - 语言任务的通用架构

TL;DR本文提出一种名为 X-DETR 的算法,针对具有挑战性的逐实例视觉语言任务进行研究;X-DETR 的架构包括对象检测器、语言编码器和视觉语言对齐器;该算法采用弱监督来扩大知识覆盖范围,经测试准确率高且速度快。