CVPRApr, 2023
具有判别性微调的跨领域图像字幕生成
Cross-Domain Image Captioning with Discriminative Finetuning
Roberto Dessì, Michele Bevilacqua, Eleonora Gualdoni, Nathanael Carraz Rakotonirina, Francesca Franzon...
TL;DR本文提出在自我监督的证明性沟通目标情况下对预先训练的神经字幕系统进行微调,使其生成更详细的图像描述,并在 Conceptual Captions 数据集上进行验证。