Jun, 2024

更新 CLIP 以偏爱描述而非标题

TL;DR通过使用 Concadia 数据集来更新 CLIP 模型,使用参数高效微调和基于因果可解释性的损失目标,以区分描述和标题,并获得盲人和弱视人群的判断,同时保持转移能力和可解释性结构。