Mar, 2024

DSGG:稠密关系变换器用于端到端场景图生成

TL;DR本文介绍了一种新的基于Transformer的方法,称为DSGG,将场景图检测视为基于一组独特的图感知查询的直接图预测问题,并采用放松子图匹配的方式获取图节点及其关系的紧凑表示,以及通过关系蒸馏策略来解决关系语义重叠问题。实验结果表明,该模型在场景图生成任务上取得了最先进的结果,在mR@50和mR@100方面分别取得了3.5%和6.7%的显著改进,在全景场景图生成任务上甚至取得了8.5%和10.3%的更大改进。