Oct, 2023

研究 CLIP 模型的限制:最差表现的分类

TL;DR通过研究 CLIP 模型中两种形式的对齐并提出类别匹配边界来解决其性能不足的问题,成功提高了 ImageNet 上最差 10 个类别的准确率,无需手动优化或访问标记验证数据。