Apr, 2021

MDETR -- 基于调制的端到端多模态理解检测

TL;DR该研究提出了基于 transformer-based 的 MDETR 多模态推理系统,能够从图像中提取物体并进行相关性文本推理,实验表明在对象检测、自然语言问题回答等任务中均获得了最佳表现。