May, 2023

易于解释的设计视觉问答

TL;DR本文重点研究视觉问答(VQA)中Black-box多模型的解释性问题,提出InterVQA:Interpretable-by-design VQA方法,在保持最新技术水平的同时,设计了明确的中间动态推理结构,强制符号推理仅用于最终答案预测,以产生高质量的明确中间推理步骤。