Dec, 2023
运用多层对比学习在VQA中实现更加忠实的自然语言解释
Towards More Faithful Natural Language Explanation Using Multi-Level
Contrastive Learning in VQA
TL;DR为了解决VQA-NLE模型在逻辑推理、事实一致性和语义扰动不敏感性等方面存在的问题,我们提出了一种基于自监督多层对比学习的自然语言解释模型(MCLE),通过提取具有辨别性的特征并将解释的特征空间与视觉问题和答案对齐,生成更一致的解释。我们通过广泛的实验、消融分析和案例研究来证明我们方法的有效性。