掌纹识别的尺度感知竞争网络
将全局和局部特征相结合的新框架可提高掌纹匹配准确性,结合 ViT 和 CNN 特征的基于移动设备的 Palm-ID 系统在 AMD EPYC 7543 32-Core CPU 上以 128 个线程在 18ms 内提取模板,在 0.33ms 内对 10,000 个掌纹图库进行高效搜索,并在大规模操作数据集上实现 98.06% 的真正接受率(TAR)和 0.01% 的误认为真率(FAR),同时在移动设备中嵌入完整的识别流程以提升用户隐私和安全。
Jan, 2024
本论文提出了 AutoScaler,一种通过权重共享的特征网络计算多尺度特征图并通过注意力网络实现最佳组合,从而在视觉对应任务中实现自适应感受野大小的规划。该网络与典型的光流和语义匹配基准方法相比具有更优秀的结果,并可推广至改善手动指定的描述符上进行视觉对应任务。同时,该注意力网络能够生成可视化的尺度注意力映射。
Nov, 2016
近年来,指节纹理 (FKP) 因其丰富的纹理图案而受到关注,使其成为一个有前景的用于身份识别的生物特征。先前的 FKP 识别方法主要利用一阶特征描述符,能捕捉纹理的细节,但无法考虑结构信息。然而,新兴的研究表明,描述纹理曲线和弧线的二阶纹理包含了被忽视的结构信息。本文介绍了一种新颖的 FKP 识别方法,Dual-Order Texture Competition Network (DOTCNet),旨在全面地捕捉 FKP 图像中的纹理信息。DOTCNet 包括三个双阶纹理竞争模块 (DTCMs),分别针对不同尺度的纹理。每个 DTCM 采用可学习的纹理描述符,具体来说就是可学习的 Gabor 滤波器 (LGF),用于提取纹理特征。通过利用 LGF,网络提取一阶和二阶纹理来全面描述精细纹理和结构特征。此外,一种注意力机制增强了一阶纹理中的相关特征,从而突出了重要的纹理细节。对于二阶纹理特征,一种竞争机制强调了结构信息,同时减少了高阶特征的噪声。广泛的实验证明,DOTCNet 在公开可用的 PolyU-FKP 数据集上明显优于几种标准算法。
Jun, 2024
提出了一种使用多分支尺度感知注意力网络、卷积神经网络、软注意力机制、尺度感知损失函数等方法,在 4 个不同的人群计数数据集上实现了最先进的效果,平均减少 25% 的误差。
Jan, 2019
胰腺癌的早期准确检测和分割对于改善治疗结果至关重要。本研究提出了一种多尺度注意力网络,结合形状上下文和先验约束来实现强大的胰腺分割,通过多尺度特征提取模块和混合尺度注意力融合模块解决了模糊的胰腺边界问题,并引入形状上下文模块和主动形状模型来建模语义和形状先验。在 NIH 和 MSD 数据集上的实验证明了我们模型的有效性,其 Dice Score 分别提高了 1.01% 和 1.03%。我们的架构在处理胰腺模糊边界、尺度和形状变化方面具有强大的分割性能。
Dec, 2023
本文提出了一种新颖的注视模型用于语义分割,该模型聚合了多尺度和上下文特征进行预测。该模型使用骨骼卷积神经网络框架输入多个不同的尺度,进而可以获取不同尺度的表示。提出的注视模型将分别处理不同尺度的特征并集成它们。然后,该模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权。此外,我们添加了一个重新校准分支,与位置注视分支平行,用于重新校准每个类别的分数图。在 PASCAL VOC 2012 和 ADE20K 数据集上,我们取得了相当有竞争力的结果,超过了基线和相关工作。
Jul, 2018
本文提出了一种新的尺度不变的完全卷积网络(SIFCN),采用端到端的方式培训,以有效地检测手部;并设计了互补加权融合(CWF)块和多尺度损失方案来实现尺度不变性和加速训练,同时解决旋转手检测的问题。在 VIVA 数据集上运行速度比现有算法快 4.23 倍,Oxford 手检测数据集上的准确性表现则更优秀。
Jun, 2019
提出了一种尺度感知网络 (SAN),将卷积特征从不同的尺度映射到尺度不变的子空间,使基于 CNN 检测方法更具鲁棒性。该方法有效地减少了尺度空间内的特征差异,可以应用于许多基于 CNN 的检测方法中,提高检测精度并略微增加计算时间。
Aug, 2018
本论文研究了怎样在卷积神经网络中实现多尺度特征表示,提出了一种注重对每个像素位置进行加权的注意力机制。通过对三个大型数据集的广泛实验,证明了该方法的有效性。
Nov, 2015
本研究提出了一种名为 SACANet 的新型尺度自适应、具有长程上下文感知能力的网络,用于解决高度拥挤、尺度变化大且存在多个孤立集群的人群计数问题,并且在测试中表现出更高的准确性和更低的平均绝对误差。
Sep, 2019