Nov, 2023

遥感视觉问答中的语言偏见诅咒:空间属性、语言多样性和明确评估的作用

TL;DR遥感视觉问答(RSVQA)是通过自然语言实现人机交互,利用航空图像为大众提供了新的机会。然而,RSVQA 中的语言偏见问题往往被忽视,而这会影响模型的健壮性并导致关于模型表现的错误结论。因此,本研究旨在通过视觉盲模型、对抗性测试和数据集分析三个方面来凸显 RSVQA 中的语言偏见问题,并提出更具信息量和互补性的评估指标,力求透明地传达未来 RSVQA 方法的结果。