Jul, 2018

多尺度细化的注意力语义分割

TL;DR本文提出了一种新颖的注视模型用于语义分割,该模型聚合了多尺度和上下文特征进行预测。该模型使用骨骼卷积神经网络框架输入多个不同的尺度,进而可以获取不同尺度的表示。提出的注视模型将分别处理不同尺度的特征并集成它们。然后,该模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权。此外,我们添加了一个重新校准分支,与位置注视分支平行,用于重新校准每个类别的分数图。在 PASCAL VOC 2012 和 ADE20K 数据集上,我们取得了相当有竞争力的结果,超过了基线和相关工作。