CVPRAug, 2022

MaskCLIP:屏蔽自蒸馏提升对比度语言 - 图片预训练

TL;DR该文介绍了一个名为 MaskCLIP 的简单而又有效的框架,将一种新提出的掩码自蒸馏方法融入了对比语言 - 图像预训练中。该框架主要利用掩码自蒸馏方法学习局部信息传递,这对文本相关表示的对比学习起到补充作用,并且一定程度上能够从自然语言中得到间接监督。同时,在文本分支中也引入了局部语义监督来提高预训练性能,这个框架在不同的任务中取得了很好的效果。