MMAug, 2020

DeVLBert:学习去混淆视觉语言表征

TL;DR本文提出了 Deconfounded Visio-Linguistic Bert 框架,解决了视觉语言预训练中的跨域问题,并通过干预学习减轻数据集偏差,从而提高了模型的泛化能力。