空洞卷积多尺度上下文聚合
本文介绍了一种新的用于高分辨率密集预测的卷积神经网络架构,称为 D3Net,其采用了多分辨率学习和逐渐膨胀的感受野来同时建模局部和全局模式,避免了深度网络中的深度耗散问题,并在图像和音频处理任务中取得了优越的性能。
Nov, 2020
该研究提出了一种基于序列到序列学习的多标签文本分类模型,其使用了多级膨胀卷积和相应的混合注意机制来生成更高级的语义单元表示,并且有效地减少了维度和支持了接收域的指数级扩展。实验结果表明,该模型在数据集 RCV1-V2 和 Ren-CECps 上具有显著优势,并且分析表明该模型与确定性分层模型相当,同时更具有对低频标签进行分类的鲁棒性。
Aug, 2018
本文提出利用扩张滤波器来构建聚合模块,以实现无透视计数的多列卷积神经网络。实验证明,我们的方法在许多基准数据集上胜过现有技术,并且结合更高数量的列来使用我们的聚合模块对于多尺度计数是有益的。
Apr, 2018
本文提出了基于扩张卷积的 Inception 模块,利用多尺度信息构建深度神经网络,提高单幅图像超分辨率的性能。实验结果表明,该方法优于许多单幅图像超分辨率方法。
Jul, 2017
本文提出一种新的方法通过采用自动上下文来利用多尺度堆叠 3D FCN 金字塔,从而提高分辨率执行语义分割。 我们在手动注释的 377 个胃手术的 CT 影像数据集上训练和验证模型,并获得近 90%的 Dice 分数。
Jun, 2018
本研究设计了一种双并行、使用不同扩张率的卷积层的 ResNeXt,以提高区域感知率和保留局部细节,进而实现语义分割,并在实时 Cityscapes 和 CamVid 数据集上取得迄今最优成果。
Nov, 2021
本研究提出了一种利用多层感知域适用于遥感图像的语义分割的新技术,通过训练一个具有不同感知域的扩张网络,从多种异质性环境下获取信息,从训练样本中定义最佳输入补丁大小,显著提高了像素分类精度。
Apr, 2018
本文提出了一种新颖的注视模型用于语义分割,该模型聚合了多尺度和上下文特征进行预测。该模型使用骨骼卷积神经网络框架输入多个不同的尺度,进而可以获取不同尺度的表示。提出的注视模型将分别处理不同尺度的特征并集成它们。然后,该模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权。此外,我们添加了一个重新校准分支,与位置注视分支平行,用于重新校准每个类别的分数图。在 PASCAL VOC 2012 和 ADE20K 数据集上,我们取得了相当有竞争力的结果,超过了基线和相关工作。
Jul, 2018