ICCVAug, 2021

针对引用分割的视觉语言变换器和查询生成模型

TL;DR本文针对有挑战性的指称分割任务,利用注意力机制、多头注意力、查询生成模块和查询平衡模块等技术,构建了一种轻量级的网络架构来解决任务,并在 RefCOCO、RefCOCO + 和 G-Ref 三个数据集上实现了新的最高性能。