Jun, 2023
基于 Transformer 的多模态学习用于多标签遥感图像分类
Transformer-based Multi-Modal Learning for Multi Label Remote Sensing Image Classification
David Hoffmann, Kai Norman Clasen, Begüm Demir
TL;DR介绍了一种新的带有同步类令牌融合(SCT Fusion)的架构,用于处理多模态遥感(RS)图像的多模态多标签分类(MLC),该架构利用了模态特定的注意力机制,通过在每个变压器编码器块之后同步类令牌实现跨模态交换信息。