Dec, 2021

通过分类再划定:将视频场景图表现为时态二分图

TL;DR本文提出了一个新的分类-然后接地框架,以避免现有的旧方案存在的三个问题,并且进一步将视频场景图重新定义为时态二分图的形式,提出了一种新的基于二分图的 SGG 模型 BIG,通过两个步骤分类和接地有效地处理了主体对象和断言的关系。