May, 2023

视觉语言预训练数据压缩

TL;DR该论文提出一种名为 TL;DR 的视觉语言学习算法,它利用基于编码器 - 解码器的编码器来选择代表性样本,并生成新的标题,旨在将现有的大规模 VLP 数据压缩为小高质量数据集。实验证明,使用 TL;DR 压缩后的数据集能够在许多下游任务中提供与完整数据集相似或甚至更好的结果。