ACLSep, 2021
如何为遥感视觉问答寻找良好的图像 - 文本嵌入?
How to find a good image-text embedding for remote sensing visual question answering?
Christel Chappuis, Sylvain Lobry, Benjamin Kellenberger, Bertrand Le Saux, Devis Tuia
TL;DR该论文研究了三种不同的融合方法在远程遥感领域的视觉问答中的应用,并分析了与模型复杂度相关的精度提高。结果表明,采用更复杂的融合机制可以提高性能,但在实践中寻求模型复杂度和性能之间的平衡是值得的。