Jun, 2022

EBMs vs. CL: 探究自监督视觉预训练在视觉问答中的应用

TL;DR该技术报告评估了通过自监督学习训练大规模视觉和语言模型的有效性,并比较了基于能量和对比学习的表示学习方法对视觉问答任务预训练的影响,发现对比学习目前是相对更可行的选择,能够提高其泛化能力。