COLINGMar, 2024

用于可解释图像问题回答的内在子图生成

TL;DR这篇论文引入了一种可解释的基于图的 VQA 方法,并在 GQA 数据集上展示了竞争性的性能,通过在问答过程中生成一个子图作为解释来提供决策过程的洞察力。