ECCVDec, 2021

受限资源下的对比视觉 - 语言预训练

TL;DR本文提出了一种可在有限资源下进行双编码器多模态表示对齐的新方法,并证明该算法在大规模数据上的有效性。