CVPRMar, 2022

堆叠式混合注意力和群组协作学习用于无偏场景图生成

TL;DR本文提出了一种基于 Scene Graph Generation 的方法,使用 Stacked Hybrid-Attention network 作为编码器,Group Collaborative Learning 作为解码器优化策略,实现对视觉语言融合不足、信息不全的问题的提升。