CVPRMar, 2024

DSGG:稠密关系变换器用于端到端场景图生成

TL;DR本文介绍了一种新的基于 Transformer 的方法,称为 DSGG,将场景图检测视为基于一组独特的图感知查询的直接图预测问题,并采用放松子图匹配的方式获取图节点及其关系的紧凑表示,以及通过关系蒸馏策略来解决关系语义重叠问题。实验结果表明,该模型在场景图生成任务上取得了最先进的结果,在 mR@50 和 mR@100 方面分别取得了 3.5%和 6.7%的显著改进,在全景场景图生成任务上甚至取得了 8.5%和 10.3%的更大改进。