ICLRFeb, 2024

跨架构的零样本泛化视觉分类

TL;DR深度网络的概括性是未见数据的关键要求,但其与分类准确性的关系尚不清楚。使用极简的视觉数据集和一种概括能力度量,我们展示了受欢迎的网络,从深度卷积网络(CNN)到 Transformer,在层级和体系结构的不同方面对未见类别的外推能力存在差异。准确性不能很好地预测概括能力,并且概括能力与层级深度变化的关系是非单调的。