基于空间注意力的分布整合网络用于人体姿势估计

Nov, 2023

基于空间注意力的分布整合网络用于人体姿势估计

Spatial Attention-based Distribution Integration Network for Human Pose Estimation

Sihan Gao, Jing Zhu, Xiaoxuan Zhuang, Zhaoyue Wang, Qijin Li

TL;DR通过引入空间注意力分布集成网络 (SADI-NET)，进一步提高人体姿势估计的准确性，在应对具有挑战性的场景时，包括遮挡、多样化外观、光照变化和重叠等方面，取得了显著的改进和最先进的性能表现。

Abstract

In recent years, human pose estimation has made significant progress through the implementation of deep learning techniques. However, these techniques still face limitations when confronted with →

human pose estimation deep learning techniques challenging scenarios spatial attention-based distribution integration network state-of-the-art performance

发现论文，激发创造

SADRNet：用于鲁棒的 3D 密集人脸对齐和重建的自对准双面回归网络

本文提出了一种自对齐的双重脸部回归网络 (SADRNet) 框架，通过建模遮挡和姿势，将三维面部的密集对齐和重建问题分解为几个相对更易于处理的子任务，分别预测一个姿态相关面和一个姿态无关面，再由遮挡感知的自对齐组合生成最终的三维面部，实验结果表明该方法在 AFLW2000-3D 和 Florence 等基准测试上显著优于现有最先进方法。

Jun, 2021

学习面部超分辨率的空间注意力

本篇论文介绍了一种基于 SPARNet 和 Face Attention Units（FAU）的空间注意力残差网络（SPARNet），能够在处理低分辨率人脸图像时捕捉到关键面部结构并生成高质量和高分辨率的结果。研究表明，该方法在多种度量标准上的表现优于当前最先进的方法，并能够对合成和真实世界低质量人脸图像进行有效泛化，不需要额外的人工标记数据。

Dec, 2020

SAR-Net: 多尺度定向感合成孔径雷达网络

SAR-Net 是一个专门设计用于合成孔径雷达 (SAR) 目标检测中全局融合方向感知信息的创新框架，通过 Unity 补偿机制 (UCM) 和方向感知注意模块 (DAM) 实现了全局信息融合和消除背景干扰的功能。通过在飞机和船只数据集上进行实验，验证了 SAR-Net 在目标检测领域取得了最先进的结果，证实了其泛化能力和鲁棒性。

Dec, 2023

SIENet：用于三维点云物体检测的空间信息增强网络

使用 LIADAR 进行三维物体检测时，由于点云密度不均衡，距离传感器更远的物体采集的点较少，导致检测精度下降。为解决这一挑战，作者提出了名为 SIENet 的二阶段三维物体检测框架，其中设计了空间信息增强模块和多分支的混合范式区域提案网络 (HP-RPN) 等，其在 KITTI 三维物体检测基准测试数据集上取得了远超其他方法的显著性能表现。

Mar, 2021

DRSI-Net: 双重残差空间交互网络用于多人姿态估计

为了解决多人姿势估计中局部和全局信息不匹配的问题，本文提出了一种高精度低复杂度的 Dual-Residual Spatial Interaction Network (DRSI-Net)。通过在邻居特征上递归地进行残差空间信息交互，保留更有用的空间信息并在浅层和深层特征之间得到更多相似性。多尺度特征融合中引入的通道和空间双重关注机制有助于网络自适应地关注与目标关键点相关的特征并进一步改进生成的姿势。同时，通过优化交互通道维度和梯度流的分割，设计了轻量级的空间交互模块，从而减少了网络的复杂性。根据在 COCO 数据集上的实验结果，DRSI-Net 在精确性和复杂性方面均优于其他最先进的方法。

Feb, 2024

全景视频显著目标检测的空时双模混合流网络

通过引入 Inter-Layer Attention 模块、Inter-Layer weight 模块和 Bi-Modal Attention 模块，本研究提出了一种 Spatial-Temporal Dual-Mode Mixed Flow 网络（STDMMF-Net），该网络利用全景视频的空间流和对应的光流来实现显著目标检测。实验证明，与最先进的方法相比，该方法在检测准确性、模型推理所需内存、测试时间、复杂性和泛化能力等方面表现更好。

Oct, 2023

强调有效图像恢复的关键特征

本研究提出了一种高效有效的框架，用于适应不同区域间存在的不同程度退化的图像恢复，并且在合成和真实数据集上优于目前的最先进方法。

May, 2024

基于重新构建的三维网络与区域注意力机制的 RGB-D 手势识别

本文使用神经结构搜索技术，并结合自适应的网络结构及局部注意力，提出了一种针对手势识别的 RAAR3DNet 方法，该方法有效地提取了手臂区域以及运动信息，并在两个大型 RGB-D 手势数据集上超越了现有技术。

Feb, 2021

全注意力网络用于语义分割

该研究提出了 FLANet 方法，可以通过单个相似度图来同时编码空间和通道注意力，并在三个具有挑战性的语义分割数据集上最先进的性能达到 83.6％，46.99％和 88.5％。

Dec, 2021

视频异常检测的多尺度空时交互网络

我们提出了一种多尺度时空交互网络（MSTI-Net），采用基于注意力机制的时空融合模块（ASTM）代替直接融合，并注入多个 ASTM 基础的连接，以促进所有可能的空间时间交互，最终将在多个尺度上学习的正常信息记录在内存中，在测试阶段增强异常和正常事件之间的区分。该方法在三个标准数据集上取得了良好的实验结果，UCSD Ped2 的 AUC 值达到了 96.8％，CUHK Avenue 的 AUC 值达到了 87.6％，ShanghaiTech 数据集的 AUC 值达到了 73.9％。

Jun, 2023