Oct, 2023

通过大型语言模型进行弱监督下的细粒度场景图生成

TL;DR通过利用大型语言模型和链式思维及上下文少样本学习策略,我们提出了一种新方法:用于弱监督场景图生成的大型语言模型,可以从图片标题中提取三元组并与目标数据的实体 / 谓词类对齐,有效地解决语义过度简化和低密度场景图的问题,实验证明该方法在 Recall@K 和平均 Recall@K 上相较于现有的弱监督场景图生成方法具有显著的提升,且能够以少量的训练图片进行有效的模型训练。