Aug, 2024
基于检索增强的自然语言推理用于可解释的视觉问答
Retrieval-Augmented Natural Language Reasoning for Explainable Visual
Question Answering
TL;DR本研究解决了视觉问答与自然语言解释任务中推理能力不足的问题。提出了ReRe模型,通过利用记忆中的检索信息来生成准确答案和有说服力的解释,避免了复杂网络和额外数据集的依赖。ReRe在视觉问答准确度和解释评分上均优于以往方法,显示出更强的说服力和可靠性。