ICCVAug, 2019

Seq-SG2SL: 通过序列到序列学习从场景图推断语义布局

TL;DR本文介绍了 Seq-SG2SL 的框架,使用两种语言的序列代理,通过 Transfomer-based seq-to-seq 模型将情景图分解成语义片段(SF),然后将其转换为砖块操作代码段(BACS)以创建语义布局。该模型被称为 Seq-SG2SL,可以预测语义布局,从而在 Visual Genome 数据集上显示其优越性。