Aug, 2023

CTP: 基于兼容的动量对比和拓扑保持的视觉-语言持续预训练

TL;DR通过研究视觉-语言持续预训练(VLCP)的特征和挑战,我们提出一种名为CTP的新算法,即兼容动量对比与拓扑保持。该方法不仅在性能上优于其他基线模型,而且不会带来昂贵的训练负担。