Mar, 2022

MORE: 多阶关系挖掘用于3D场景中的密集字幕生成

TL;DR本文提出MORE,一种多阶关系挖掘模型,通过逐步建立空间布局图卷积和基于对象中心的三元组注意力图来捕捉和利用三维场景中的复杂关系,以生成更全面和描述性的标题,证明了MORE和其组件的有效性,并超过了现有的最新方法。