Aug, 2023

广义无偏场景图生成

TL;DR现有的无偏场景图生成方法只关注高频类占据稀有类预测的谓词级不平衡,而忽视了概念级别的不平衡。因此,我们提出了一个新的研究问题:广义无偏场景图生成(G-USGG),它考虑了谓词级和概念级的不平衡。为了解决这个问题,我们引入了多概念学习(MCL)框架,通过多个概念原型在同一类中表示不同数量的概念来量化谓词之间的概念级不平衡,并通过概念正则化(CR)技术有效地学习概念原型。此外,为了实现对不同概念的平衡学习,我们引入了平衡原型记忆(BPM),指导 SGG 模型生成平衡的概念原型表示。广泛的实验证明了我们的模型无关策略在提高 VG-SGG 和 OI-SGG 数据集上基准模型性能方面的显著有效性,取得了谓词级无偏关系识别和概念级组合生成两个关键方面的最新成就。