EMNLPDec, 2022

基于跨模态相似性的课程学习在图像描述中的应用

TL;DR该研究提出一种基于跨模态相似性的难度度量方法,用于图像字幕生成模型的训练,并在 COCO 和 Flickr30k 数据集上验证了其有效性,证明其在难样本和未见数据上表现出较高的泛化能力。