Oct, 2023

CLIP 的零射类别视觉分类的内部模态代理学习

TL;DR通过使用文本数据的代理标签帮助直接学习图像数据的代理标签,并利用相应的分析方法进一步提炼这些标签,以改善视觉任务中的零 - shot 分类准确率。