MMAug, 2020
DeVLBert:学习去混淆视觉语言表征
DeVLBert: Learning Deconfounded Visio-Linguistic Representations
Shengyu Zhang, Tan Jiang, Tan Wang, Kun Kuang, Zhou Zhao...
TL;DR本文提出了 Deconfounded Visio-Linguistic Bert 框架,解决了视觉语言预训练中的跨域问题,并通过干预学习减轻数据集偏差,从而提高了模型的泛化能力。