Jun, 2023
远程感知中的视觉问答:跨注意力与多模态信息瓶颈
Visual Question Answering in Remote Sensing with Cross-Attention and Multimodal Information Bottleneck
Jayesh Songara, Shivam Pande, Shabnam Choudhury, Biplab Banerjee, Rajbabu Velmurugan
TL;DR本研究提出了一种基于跨注意力的信息最大化的方法,结合 CNN-LSTM,并在两个不同分辨率的 VQA 遥感数据集上评估表现,获得了较高的准确率。