Jul, 2024
CTRL-F:通过多级特征交互和表示学习融合,在图像分类中将卷积与Transformer结合
CTRL-F: Pairing Convolution with Transformer for Image Classification
via Multi-Level Feature Cross-Attention and Representation Learning Fusion
TL;DR通过将卷积和transformer的优势相结合,我们提出了一种轻量级混合网络CTRL-F,结合了Representation Learning Fusion和Multi-Level Feature Cross-Attention两种技术,用于图像分类任务,实验表明我们的模型在大规模数据和低数据条件下取得了最先进的性能。