CVPRMay, 2021
利用胶囊网络进行弱监督的视觉问答
Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules
Aisha Urooj Khan, Hilde Kuehne, Kevin Duarte, Chuang Gan, Niels Lobo...
TL;DR本研究提出了一种视觉胶囊模块,并使用基于查询的胶囊特征选择机制,在仅使用 VQA 任务的情况下弱监督地培训相关视觉实体的基础上,演示了将该模块集成到现有的 VQA 系统中如何显著提高其性能,并在 CLEVR-Answers 基准测试和 GQA 上进行了评估。