ICCVJul, 2023

指导图像字幕模型生成更具体的字幕

TL;DR基于图像的标题生成任务中,我们展示了通过微调自回归标题模型来生成更具体的标题,并且在解码过程中应用语言模型指导,从而在参考自由和参考依据的标题度量指标之间取得一定的平衡。