Mar, 2022

视觉语言预训练模型是否学习可组合的基本概念?

TL;DR本文研究预训练可视化学习模型是否会自动产生原始概念的表示,例如物体部分的颜色和形状,提出了一个用于探究这个问题的两步框架:组合概念映射 (CompMap),证明组合模型可以被设计为一组操作,并发现用基本概念激活的模型可以用于细粒度视觉识别和组合泛化任务。