Oct, 2023

教师引导的组合视觉推理的多模态表示

TL;DR通过利用跨模态特征和更有效的训练技术,加强了神经模块网络在视觉问答中的性能和透明度。