基于 Kronecker 的树状卷积网络用于语义分割
远程感知场景分类是一个具有挑战性和有价值的研究课题,其中卷积神经网络在其中发挥着至关重要的作用。本文提出了一种利用 Kronecker 积的新型特征融合算法,并讨论了与该算法相关的反向传播过程,实验证明了该方法在远程感知场景分类中提高卷积神经网络准确性的有效性。
Jan, 2024
本文旨在设计 DeepLabv3 系统进行语义图像分割,并通过引入多尺度上下文与全局信息,使用多种空洞卷积组合实现对多尺度物体的分割,最终在 PASCAL VOC 2012 语义图像分割基准测试中取得了令人满意的表现。
Jun, 2017
本研究提出了一种基于多任务全卷积架构的方法,利用超光谱无人机数据从稀疏和有限的多边形注释中进行密集森林的树种映射。通过实现局部损失函数和距离回归互补任务,该模型从非密集的训练样本中实现了密集的树木语义标记结果,并使用共享的骨干网络和两个任务特定解码器来学习两个任务的普遍表示,并取得了热带森林树种分类的最先进性能。
Jun, 2021
本研究提出一种新的架构,称为 “时间通道感知” 块 (TCA),它能够利用视频序列之间的时间关联,通过结合局部和全局上下文信息,提升特征表示的判别能力,实现更准确的人群计数等任务。实验证明,通过堆叠 TCA 块,所得到的改进的 3D 卷积神经网络 (E3D) 在多个基准数据集上具有优异的性能。
Aug, 2019
本文提出了一种基于卷积神经网络的 Fully Convolutional Networks(FCN)方法,可以用于图像的深度语义分割。通过该方法,我们成功地提高了 PASCAL VOC、NYUDv2、SIFT Flow 和 PASCAL-Context 等公开数据集上的 segmentation 模型的性能,并且推断速度远快于之前的相关工作。
May, 2016
本文提出了一种利用 Deep Learning 完成语义图像分割的方法,通过引入 atrous convolution 以及 atrous spatial pyramid pooling 来解决对象掩模问题,并结合 max-pooling 和 downsampling 与全连接条件随机场(CRF)来提高对象边界的定位准确性,在 PASCAL VOC-2012 等数据集上全面超越了以往的成果。
Jun, 2016
该研究证明,卷积网络可以通过端到端的训练,从像素到像素地训练,超越先前的语义分割最先进方法,通过自适应大小输入和高效学习来生成相应大小的输出。该研究还详细介绍了全卷积网络的应用于空间密集预测任务,并将 AlexNet、VGG 网和 GoogLeNet 等现代分类网络改进成全卷积网络,并将它们学习到的表示通过微调应用于语义分割任务。最后,该研究提出了一种新的网络架构,将深层次粗糙层和浅层外观信息相结合以生成准确和详细的分割结果,在 PASCAL VOC、NYUDv2 和 SIFT Flow 数据集上实现了最先进的语义分割(2012 年的 mean IU 相较前一方法提高 20%),对典型图像的推理时间仅需三分之一秒。
Nov, 2014
本文提出了可学习的树型滤波器,通过利用最小生成树的结构性质来模拟远程依赖关系并保留细节,形成了一个通用的树型滤波模块,实现了具有高效的线性时间算法以减少资源消耗,为语义分割提供了一个统一的框架,与传统的 PSP 块和非本地操作相比,具有更好的性能和更少的开销,在多个基准测试中获得了持续的改进,通过给定链接提供代码和模型。
Sep, 2019
本研究提出了一种基于树的卷积神经网络(TBCNN),用于区分性句子建模。文章通过 constituency trees 或 dependency trees 提取句子的结构特征,并通过最大池聚合这些特征。我们评估了我们的模型在情感分析和问题分类两个领域的表现,TBCNN 的表现均优于以前的最新结果,包括现有的神经网络和专门的特征 / 规则工程方法。我们还努力可视化基于树的卷积过程,来解释我们的模型工作原理。
Apr, 2015