Mar, 2024

消除 CLIP 的偏差:多模态学习中数据平衡的实用性如何?

TL;DR探讨使用数据平衡来减轻对比语言 - 图像预训练(CLIP)中的偏见的有效性,提出了一种名为 Multi-Modal Moment Matching(M4)的新算法,用于减少多模态数据中的表示和关联偏见,并对 CLIP 对偏见的学习和遗忘的动态性进行了分析。