MMSep, 2023

带有语义级别共识提取和分散的共显目标检测

TL;DR给定一组图像,合作显著目标检测(CoSOD)的目标是突出显示每个图像中的共同显著对象。本文提出了一种基于分层 Transformer 模块的方法,用于提取语义级共识,以获得对公共对象类别更全面的表示,并排除与目标对象具有局部相似性的其他对象的干扰。此外,还提出了一种基于 Transformer 的分散模块,它考虑了不同场景中协同显著对象的变化。它以图像特征图的图像特定方式对共识进行分发,同时充分利用组内的交互。这两个模块与 ViT 编码器和类似 FPN 的解码器一起集成成一个可端到端训练的网络,不需要额外的分支和辅助损失。该方法在三个常用的 CoSOD 数据集上进行评估,并取得了最先进的性能。