Jun, 2023

基于 Transformer 的多模态学习用于多标签遥感图像分类

TL;DR介绍了一种新的带有同步类令牌融合(SCT Fusion)的架构,用于处理多模态遥感(RS)图像的多模态多标签分类(MLC),该架构利用了模态特定的注意力机制,通过在每个变压器编码器块之后同步类令牌实现跨模态交换信息。