ICCVApr, 2021

猪也会飞:合成和自然场景下的情境推理

TL;DR通过一个多样化的、合成的虚拟家庭环境 -“场景背景” 数据集 (OCD),本文提出了一种基于上下文的识别变压器模型,将对象和背景信息通过多头注意模式进行融合,能够捕捉上下文推理的有用信息,在 OCD 和其他 “场景背景” 数据集上,使人机都能表现出类似的性能和更好的较强的鲁棒性。