CVPRMar, 2023

使用自由语言建模加速视觉语言预训练

TL;DR本研究提出了一种新的预训练任务:自由语言建模 (FLM),它通过自定义每个预测令牌的污染范围解决了掩码语言建模 (MLM) 中预测率和污染率之间的问题,成功地将预测率从污染率的捆绑中解放出来,从而加速了视觉 - 语言预训练的收敛速度,减少了训练时间,并且在视觉 - 语言理解和生成任务上达到了有竞争力的性能。