Jan, 2021

VinVL: 重访视觉表征在视觉语言模型中的应用

TL;DR本文通过提出一种改进的物体检测模型,生成具有更丰富视觉对象和概念的物体中心表示,从而显着提高了视觉语言任务的性能,并在七个公共基准测试中创造了新的最先进结果。