ICCVAug, 2021
针对引用分割的视觉语言变换器和查询生成模型
Vision-Language Transformer and Query Generation for Referring Segmentation
Henghui Ding, Chang Liu, Suchen Wang, Xudong Jiang
TL;DR本文针对有挑战性的指称分割任务,利用注意力机制、多头注意力、查询生成模块和查询平衡模块等技术,构建了一种轻量级的网络架构来解决任务,并在 RefCOCO、RefCOCO + 和 G-Ref 三个数据集上实现了新的最高性能。