Jan, 2021
VinVL: 重访视觉表征在视觉语言模型中的应用
VinVL: Revisiting Visual Representations in Vision-Language Models
Pengchuan Zhang, Xiujun Li, Xiaowei Hu, Jianwei Yang, Lei Zhang...
TL;DR本文通过提出一种改进的物体检测模型,生成具有更丰富视觉对象和概念的物体中心表示,从而显着提高了视觉语言任务的性能,并在七个公共基准测试中创造了新的最先进结果。