Jun, 2023

远程感知中的视觉问答:跨注意力与多模态信息瓶颈

TL;DR本研究提出了一种基于跨注意力的信息最大化的方法,结合 CNN-LSTM,并在两个不同分辨率的 VQA 遥感数据集上评估表现,获得了较高的准确率。