May, 2024

从视觉语言模型中学习不变的因果机制

TL;DR我们提出了 CLIP-ICM(Invariant Causal Mechanism of CLIP)算法,该算法旨在通过干预数据来可靠地识别不变的潜在因素,并在各个领域中实现准确的预测。理论分析表明,我们的方法在分布外(OOD)场景中具有较低的泛化下界,实验结果展示了 CLIP-ICM 的卓越性能。