Nov, 2024
斯巴鲁VQE:课程内容理解的视觉问题解释
SparrowVQE: Visual Question Explanation for Course Content Understanding
TL;DR本研究针对视觉问答(VQA)方法提供简单、简短回答的问题,提出了视觉问题解释(VQE)的新方法。通过构建MLVQE数据集并开发小型多模态模型SparrowVQE,我们的研究显示SparrowVQE在理解视觉信息方面表现优异,并在多个基准VQA数据集中超越了最新的方法,提升了VQA系统的解释能力。