Sep, 2023

用于答案定位的句子注意力模块

TL;DR提出了一种名为 “Sentence Attention Block” 的新型建筑模块,通过明确建模图像特征图与句子嵌入之间的相互依赖关系,重新校准了通道级图像特征图,以过滤基于句子嵌入的不相关特征图通道,进而实现了目前最先进准确度的提高。