为更好地识别细粒度对象和动作,我们扩展了非局部模块,考虑了任意两个通道位置之间的关系,并在通道组内实现以优化性能。实验结果表明,扩展的非局部模块在细粒度对象识别和视频分类上有明显的改进和实用价值。
Oct, 2018
该论文提出了非局部操作作为一种用于捕捉长程依赖性的通用组建块,可以在许多计算机视觉体系结构中使用,并且在视频分类和静态图像识别中表现优异。
Nov, 2017
本文提出了利用多种全局描述符来在端到端训练中获得合集效应的新框架,并通过定量和定性分析研究了多种全局描述符组合的有效性。在基准评估中,该框架在图像检索任务中实现了最先进的性能。
Mar, 2019
本文介绍了一种通过局部和全局扩散来增强时空表示学习的新框架,其网络结构由 LGD 块组成,通过模拟这两种表示之间的扩散来更新局部和全局特征,并引入核分类器将两个方面的表示相结合,在视频识别中取得了 3.5%和 0.7%的性能提升。
Jun, 2019
本文提出了一种新方法进行实例级别的图像检索,通过聚合多个基于区域的描述符为每个图像生成全局紧凑的固定长度表示,该方法基于一个特定图像检索任务训练的深度架构,利用排序框架来学习卷积和投影权重,并采用区域建议网络来学习应汇集哪些区域以形成最终的全局描述符。
Apr, 2016
通过采用上下文增强和空间注意机制,本文提出了一种可获得非局部感知的本地描述符方法,并在诸如 HPatches,Aachen Day-Night 定位和 InLoc 室内定位基准测试中,显著超越了先前的最先进本地描述符。
Mar, 2022
本论文提出了全局上下文网络 (GCNet),它通过一个基于无查询的公式的简化网络来实现比 Non-Local Network (NLNet) 更轻量级的全局上下文建模,并在多个骨干网络层次上使用它来构建全局上下文网络。在各种识别任务的主要基准测试中,GCNet 通常优于 NLNet。
Dec, 2020
该论文提出了一种名为 GALD 的网络结构,通过全局聚合和本地分布两个步骤,对物体位置大小进行估计,从而更加准确地建立物体间的长程依赖关系,实现语义分割和物体检测任务中的新的最先进性能。
Sep, 2019
通过评估全球特征表示法的适用性和性能对分层拓扑映射技术进行定量比较,发现基于无监督学习的变分自编码器(VAE)的全球特征表示法在连续性和独特性方面表现出色,能够实现高效和可扩展的分层映射,运行速度比次优的 NetVLAD 全球特征表示法快 2.3 倍,比手工制作的 PHOG 全球特征表示法快 9.5 倍,而不损失整体的检索性能。
Apr, 2024
本文提出一种新颖的基于几何约束的局部描述符学习方法 ——GeoDesc,旨在改善学习局部描述符在图片三维重建中的泛化性能不足的问题。结果表明,GeoDesc 在各种大型基准测试中表现出优异的性能,并在具有挑战性的重建任务中显著成功。此外,本文提供了在 SfM 流水线中实际集成学习描述符的指南,展示了 GeoDesc 在精度和效率之间能够提供的良好平衡。
Jul, 2018