Jun, 2020

大规模对抗训练用于视觉与语言表示学习

TL;DR该研究提出了一种基于对抗训练的大规模视觉语言表示学习方法 VILLA,该方法在嵌入空间内进行对抗训练,取得了新的最优性能。