- UNet 迷失之中:通过未被重视的局部特征提升红外小目标检测
通过引入 HintU 网络,利用目标位置的先验知识突出关键的局部特征,并改进传统的 UNet-based 结构以保留目标像素,从而提高红外小目标检测的性能。
- 了解训练集大小对动物重新识别的影响
最近自动识别动物个体的方法在相机陷阱和公众科学项目中的应用开启了研究野生动物的新可能性。本研究通过对六种不同方法和五种动物物种的全面实验来深入探讨训练数据集规模对算法性能的影响,结果显示基于局部特征和端到端学习的方法都有优势,但对于野生动物 - CVPRXFeat: 轻量级图像匹配的加速特征
我们提出了一种轻量级且准确的资源高效视觉对应体系结构,称为 XFeat,通过重新审视卷积神经网络的基本设计选择以侦测、提取和匹配局部特征来满足对适用于资源受限设备的快速且稳健算法的关键需求。我们的模型是第一个高效提供半稠密匹配的模型,利用对 - X-3D:点云识别的显式三维结构建模
X-3D 是一种显式的三维结构建模方法,通过捕捉输入的三维空间中的显式局部结构信息,并结合当前局部区域中所有邻域点的共享权重产生动态核心,有效地改善了嵌入空间的局部结构与原始输入点云之间的差异,提高了局部特征的提取能力。
- 移动非接触式掌纹识别:多尺度多模型嵌入
将全局和局部特征相结合的新框架可提高掌纹匹配准确性,结合 ViT 和 CNN 特征的基于移动设备的 Palm-ID 系统在 AMD EPYC 7543 32-Core CPU 上以 128 个线程在 18ms 内提取模板,在 0.33ms - 从局部对比角度理解掩码自编码器
通过对编码器 - 解码器架构以及局部对比学习的分析,本文探索了 Masked AutoEncoder 的机制,并将其改进为一种局部区域级对比学习形式,为改进自监督学习框架提供了更全面和灵活的解释。
- OTAS: 无监督的面向对象的时间动作分割的边界检测
我们提出了一种名为 OTAS 的无监督框架,通过探索局部特征的优点,实现了时域行为分割,并通过自监督全局和局部特征提取模块以及边界选择模块,融合特征并检测行为分割的显著边界。在实验中,我们发现 OTAS 相对于推荐的 F1 分数平均提高了 - 多模态梯度注意力学习用于可解释的组合图像检索
我们提出了一种基于梯度注意的学习目标,用于解决组合图像检索问题。通过引入新的注意力计算技术和学习目标,我们展示了对图像区域进行更准确的定位和改进,并通过标准基准数据集显示了更好的可解释性和竞争性的定量检索性能。
- LightGlue:轻松速配局部特征
LightGlue 是一种深度神经网络,可以跨图像学习匹配本地特征,并通过多个简单但有效的改进使其更加高效、精确、易于训练,尤其适用于对于视觉重叠度较高或外观变化有限的图像匹配问题,这为 3D 重建等对延迟敏感的应用开启了希望。
- FDNet: 用于高效、鲁棒和实用的时间序列预测的 焦点分解网络
本研究提出了 FDNet,一个面向高效、鲁棒、实际的时序预测模型,利用局部特征图从输入序列中提取精细的局部特征,实现了在没有全局粗略特征图的情况下的深度时序预测,并通过焦点输入序列分解方法解决了长序列输入问题。在六项现实世界基准测试中,FD - 基于局部特征的视觉定位的受约束近似最近邻算法 (CANN)
本文提出了一种名为 Constrained Approximate Nearest Neighbors (CANN) 的近似 K 最近邻联合解决方案,该方案只使用局部特征进行跨几何和外观空间的 K 最近邻检索以提高视觉定位的性能,并且在公共 - 卷积神经网络中的全局局部处理
本文提出了一种简单而有效的全局优势流 (Global Advantage Stream, GAS) 模块,以学习和捕捉输入样本的整体特征,并将 GAS 特征与 CNN 网络结合作为插件组件,被称为全局 / 局部处理 (Global/Loca - CVPR用于形变形态分析的通用局部特征预训练
本文介绍了一种学习可转移 3D 形状的特征的方法,通过优化感受野大小和比较不同的背景和损失函数来实现。实验证明,该方法可成功推广到人和动物等未见过的 3D 形状类别,并在分割、形状对应和分类等下游任务上实现了最先进的结果。
- CVPR学习旋转等变特征实现视觉对应
本实验引入自监督学习框架,使用群等变 CNN 提取旋转不变的局部特征,通过群对齐技术实现旋转不变性,并通过对比描述符损失和方向对齐损失训练来得到具有鲁棒性的局部特征描述符,表现出在不同环境下的高精度匹配结果,并在关键点匹配和相机姿态估计任务 - MM全局与局部的结合:基于类别感知弱监督的有效多标签图像分类
该研究构建了一个统一框架,以执行有效的噪声提议抑制并相互作用全局和局部特征进行稳健的特征学习,包括使用类别感知弱监督来集中注意力于不存在的类别为本地特征学习提供确定性信息,以及开发跨粒度注意力模块来探索全局和局部特征之间的互补信息。在 MS - EMNLP神经机器翻译的连续学习在低遗忘风险区域内进行
本篇论文提出了一种基于局部特征训练的两阶段方法,能够实现大规模预训练神经机器翻译模型的连续学习,以适应新任务,采用这种方法能够在不访问以前的训练数据或引入模型分离的情况下解决之前方法的不足。
- VICRegL:本地视觉特征的自监督学习
本文提出了一种名为 VICRegL 的新方法,该方法可以同时学习好的全局和局部特征,从而在检测和分割任务上取得出色的性能,同时保持分类任务上的良好性能。
- ECCV自监督视频表示学习的静态和动态概念
该研究提出了一种新的自监督视频表示学习方案,分别学习全局视觉概念和局部特征,使用交叉注意力机制聚合不同概念的详细本地特征来执行局部概念对比,并取得了 UCF-101、HMDB-51 和 Diving-48 的最新成果。
- ACL英雄帮派神经模型用于实体识别
本文提出了一种新的 Hero-Gang 神经网络结构,包括 Hero 和 Gang 模块,以利用全局和本地信息促进命名实体识别。实验结果表明,我们提出的模型在多个基准数据集上具有很好的性能。
- CVPR3D 物体姿态估计模板再审:对新对象的泛化和遮挡稳健性
本研究提出了一种基于 CAD 模型的局部特征匹配方法,无需对新物体进行训练即可实现新物体的识别和三维位姿估计,实验证明该方法能够实现对不同于训练集的新物体的泛化,明显优于其他基于模板匹配的方法。