CVPRMay, 2021

利用胶囊网络进行弱监督的视觉问答

TL;DR本研究提出了一种视觉胶囊模块,并使用基于查询的胶囊特征选择机制,在仅使用 VQA 任务的情况下弱监督地培训相关视觉实体的基础上,演示了将该模块集成到现有的 VQA 系统中如何显著提高其性能,并在 CLEVR-Answers 基准测试和 GQA 上进行了评估。