CVPRDec, 2021

SGTR:基于 Transformer 的端到端场景图生成

TL;DR提出了一种基于 Transformer 的端到端框架,利用结构化谓语生成器开发了一种新的实体感知的谓语表示方法,设计了图组装模块以推断适应性的进行双部分场景图形的构建,并在两个具有挑战性的基准测试中取得了最先进或可比的性能,并提高了推理效率。