Mar, 2023

组合视觉推理的课程学习

TL;DR本研究提出了基于预定义跨模态嵌入的神经模块网络方法,以 “热启动” 学习 GQA 数据集,进而采用课程学习作为一种改进训练和更好利用数据的方法,在训练期间引入中间损失,并发现这可以简化课程学习策略。多个困难标准用于定义课程学习方法,该研究表明,适当选择课程学习方法可以大大降低训练成本和训练数据量,并对最终视觉问答准确性影响有限。