CVPRApr, 2023

具有判别性微调的跨领域图像字幕生成

TL;DR本文提出在自我监督的证明性沟通目标情况下对预先训练的神经字幕系统进行微调,使其生成更详细的图像描述,并在 Conceptual Captions 数据集上进行验证。