本文提出一种轻量级全局描述符,以建模跨不同维度(如通道、帧)之间的位置交互作用,使得后续卷积能够合理地访问此全局特征,从而在计算成本和参数数量上有了巨大的降低,也完成了最有效的长距离机制。
Jul, 2019
该论文提出了非局部操作作为一种用于捕捉长程依赖性的通用组建块,可以在许多计算机视觉体系结构中使用,并且在视频分类和静态图像识别中表现优异。
Nov, 2017
本论文提出了全局上下文网络 (GCNet),它通过一个基于无查询的公式的简化网络来实现比 Non-Local Network (NLNet) 更轻量级的全局上下文建模,并在多个骨干网络层次上使用它来构建全局上下文网络。在各种识别任务的主要基准测试中,GCNet 通常优于 NLNet。
Dec, 2020
本文提出了一种新的视角,将非局部模块看作在完全连接的图上生成的一组图滤波器,并使用 Chebyshev 图滤波器推导出了一种统一的公式以解释和分析现有的非局部模块,并提出了一种更加高效和稳健的谱非局部模块,该模块可以更好地捕获深度神经网络中的长距离依赖,实验结果表明,该方法在图像分类、动作识别、语义分割和人员重识别任务中具有明显的改进和实际适用性。
Aug, 2021
利用非局部网络模型的观察结果,本研究提出一种基于查询无关表述的简化模型并将其与收缩 - 激励 (SENet) 模型进行统一,得到了一种三步的通用框架用于全局上下文建模,该框架中的轻量 GC 块可以高效地建模全局上下文,并可以应用于构建 GCNet 神经网络中的多层,该实例的性能优于 NLNet 和 SENet.
Apr, 2019
本文旨在通过对卷积神经网络中的非局部操作权重矩阵进行频谱分析,提出了新的非局部块正则化形式。通过这种方式,我们不仅可以学习非局部交互,还可以获得稳定的动态响应,从而允许更深的非局部层级结构。同时,本研究还揭示了非局部网络与其他非局部模型之间的内在关联。
Jun, 2018
该研究提出了一种基于图神经网络和潜在空间的方法,以降低图的复杂度从而实现对视觉特征的非局部关联表示,并在三项主要的视觉识别任务上展示了其具有较高的性能和较低的计算成本。
May, 2019
该研究提出了一种基于非局部稀疏性的深度卷积神经网络去噪范式,结合了卷积神经网络和非局部滤波器,证明了在大型灰度图像数据集上具有最先进的性能。
Mar, 2018
本研究提出了一种多尺度空间图卷积和多尺度时间图卷积模型,通过分解相应的局部图卷积为一系列子图卷积,形成一个分层残差体系结构,使图卷积神经网络能够捕获空间和时间域中的短程和长程依赖关系,从而实现骨骼动作识别,该模型在三个基准数据集上表现出了显著的性能。
Jun, 2022
本文介绍了一种通过局部和全局扩散来增强时空表示学习的新框架,其网络结构由 LGD 块组成,通过模拟这两种表示之间的扩散来更新局部和全局特征,并引入核分类器将两个方面的表示相结合,在视频识别中取得了 3.5%和 0.7%的性能提升。
Jun, 2019