ECCVMar, 2022

MORE: 多阶关系挖掘用于 3D 场景中的密集字幕生成

TL;DR本文提出 MORE,一种多阶关系挖掘模型,通过逐步建立空间布局图卷积和基于对象中心的三元组注意力图来捕捉和利用三维场景中的复杂关系,以生成更全面和描述性的标题,证明了 MORE 和其组件的有效性,并超过了现有的最新方法。