Jul, 2024

CTRL-F:通过多级特征交互和表示学习融合,在图像分类中将卷积与 Transformer 结合

TL;DR通过将卷积和 transformer 的优势相结合,我们提出了一种轻量级混合网络 CTRL-F,结合了 Representation Learning Fusion 和 Multi-Level Feature Cross-Attention 两种技术,用于图像分类任务,实验表明我们的模型在大规模数据和低数据条件下取得了最先进的性能。