Jun, 2023

自上而下视角的基于图像实体的图像字幕生成

TL;DR本研究提出了一种一阶段的弱监督图像标题生成方法,通过注入关系模块来鼓励多标签分类中的关系理解,从而提高了关注性能和字幕生成准确性,并在两个具有挑战性的数据集上验证了该方法的有效性。