基于空间注意力的分布整合网络用于人体姿势估计
本文提出了一种自对齐的双重脸部回归网络 (SADRNet) 框架,通过建模遮挡和姿势,将三维面部的密集对齐和重建问题分解为几个相对更易于处理的子任务,分别预测一个姿态相关面和一个姿态无关面,再由遮挡感知的自对齐组合生成最终的三维面部,实验结果表明该方法在 AFLW2000-3D 和 Florence 等基准测试上显著优于现有最先进方法。
Jun, 2021
本篇论文介绍了一种基于 SPARNet 和 Face Attention Units(FAU)的空间注意力残差网络(SPARNet),能够在处理低分辨率人脸图像时捕捉到关键面部结构并生成高质量和高分辨率的结果。研究表明,该方法在多种度量标准上的表现优于当前最先进的方法,并能够对合成和真实世界低质量人脸图像进行有效泛化,不需要额外的人工标记数据。
Dec, 2020
SAR-Net 是一个专门设计用于合成孔径雷达 (SAR) 目标检测中全局融合方向感知信息的创新框架,通过 Unity 补偿机制 (UCM) 和方向感知注意模块 (DAM) 实现了全局信息融合和消除背景干扰的功能。通过在飞机和船只数据集上进行实验,验证了 SAR-Net 在目标检测领域取得了最先进的结果,证实了其泛化能力和鲁棒性。
Dec, 2023
使用 LIADAR 进行三维物体检测时,由于点云密度不均衡,距离传感器更远的物体采集的点较少,导致检测精度下降。为解决这一挑战,作者提出了名为 SIENet 的二阶段三维物体检测框架,其中设计了空间信息增强模块和多分支的混合范式区域提案网络 (HP-RPN) 等,其在 KITTI 三维物体检测基准测试数据集上取得了远超其他方法的显著性能表现。
Mar, 2021
为了解决多人姿势估计中局部和全局信息不匹配的问题,本文提出了一种高精度低复杂度的 Dual-Residual Spatial Interaction Network (DRSI-Net)。通过在邻居特征上递归地进行残差空间信息交互,保留更有用的空间信息并在浅层和深层特征之间得到更多相似性。多尺度特征融合中引入的通道和空间双重关注机制有助于网络自适应地关注与目标关键点相关的特征并进一步改进生成的姿势。同时,通过优化交互通道维度和梯度流的分割,设计了轻量级的空间交互模块,从而减少了网络的复杂性。根据在 COCO 数据集上的实验结果,DRSI-Net 在精确性和复杂性方面均优于其他最先进的方法。
Feb, 2024
通过引入 Inter-Layer Attention 模块、Inter-Layer weight 模块和 Bi-Modal Attention 模块,本研究提出了一种 Spatial-Temporal Dual-Mode Mixed Flow 网络(STDMMF-Net),该网络利用全景视频的空间流和对应的光流来实现显著目标检测。实验证明,与最先进的方法相比,该方法在检测准确性、模型推理所需内存、测试时间、复杂性和泛化能力等方面表现更好。
Oct, 2023
本文使用神经结构搜索技术,并结合自适应的网络结构及局部注意力,提出了一种针对手势识别的 RAAR3DNet 方法,该方法有效地提取了手臂区域以及运动信息,并在两个大型 RGB-D 手势数据集上超越了现有技术。
Feb, 2021
该研究提出了 FLANet 方法,可以通过单个相似度图来同时编码空间和通道注意力,并在三个具有挑战性的语义分割数据集上最先进的性能达到 83.6%,46.99%和 88.5%。
Dec, 2021
我们提出了一种多尺度时空交互网络(MSTI-Net),采用基于注意力机制的时空融合模块(ASTM)代替直接融合,并注入多个 ASTM 基础的连接,以促进所有可能的空间时间交互,最终将在多个尺度上学习的正常信息记录在内存中,在测试阶段增强异常和正常事件之间的区分。该方法在三个标准数据集上取得了良好的实验结果,UCSD Ped2 的 AUC 值达到了 96.8%,CUHK Avenue 的 AUC 值达到了 87.6%,ShanghaiTech 数据集的 AUC 值达到了 73.9%。
Jun, 2023