Mar, 2024

利用 CLIP 进行敏感信息推断和模型公平性改进

TL;DR通过使用 CLIP 模型作为丰富的知识源来推断敏感信息,我们在图像和语言嵌入派生的相似度上进行样本聚类,并评估其与真实属性分布的一致性,然后通过重新采样和增强性能较差的聚类来训练目标模型,实验结果表明,该模型在多个基准偏见数据集上取得了明显的公平性改善,说明 CLIP 可以提取受语言触发的区分性敏感信息,用于推动模型公平性。