Oct, 2024
探索课程学习在视觉-语言任务中的应用:关于小规模多模态训练的研究
Exploring Curriculum Learning for Vision-Language Tasks: A Study on
Small-Scale Multimodal Training
TL;DR本研究针对专门领域中数据稀缺的问题,提出了一种通过课程学习优化视觉-语言任务的方法,来提高小规模多模态训练的效果。核心发现显示,相较于非课程学习模型,在结合文本预训练时,课程学习在多模态评估中展现了显著的优势,尤其是在文本单一任务中,小参数模型的训练也受益于课程学习。这一发现为如何在数据有限的环境中有效利用机器学习提供了新的见解。