BriefGPT.xyz
Ask
alpha
关键词
instance-wise vision-language tasks
搜索结果 - 1
X-DETR:一种用于实例级视觉 - 语言任务的通用架构
本文提出一种名为 X-DETR 的算法,针对具有挑战性的逐实例视觉语言任务进行研究;X-DETR 的架构包括对象检测器、语言编码器和视觉语言对齐器;该算法采用弱监督来扩大知识覆盖范围,经测试准确率高且速度快。
PDF
2 years ago
Prev
Next