ICCVOct, 2021

基于 Transformer 双关系图的多标签图像识别

TL;DR本文提出了基于 Transformer 双重关系学习框架的方法,通过构建结构关系图和语义关系图,利用显式的语义感知约束来动态地建模图像对象的语义含义,并将学习到的结构关系合并到语义图中,为多对象识别任务提供了一种新的方法。