ACLApr, 2022

XDBERT:从跨模态系统中提取视觉信息以改善语言理解的 BERT 知识蒸馏模型

TL;DR本文旨在研究如何将预训练的异模态 transformers 的视觉信息提炼给语言编码器,提出了一个被称为 XDBERT 的新框架,经过训练后在常规语言理解评估(GLUE)、有对抗生成的情况(SWAG)以及可读性基准测试上比预训练的 BERT 表现更好,并分析了 XDBERT 在 GLUE 上的表现,证明了改进很可能是基于视觉语言的。