- HPE-CogVLM:基于视觉语言模型的新头部姿势定位任务探索
本研究使用 CogVLM 的视觉定位能力,提出了一种新的框架来增强头部姿态估计任务,通过改进大语言模型中的灾难遗忘问题和引入 LoRA 层模型合并方法,有效提高头部姿态估计性能,并且在多个指标上优于现有方法。
- 野外半监督无约束头部姿态估计
通过利用大量未标记的野外头部图像,我们提出了第一个半监督的无约束头部姿势估计(SemiUHPE)方法,该方法可以应对多样性和复杂性较高的头部姿势领域,并使用动态熵过滤来自适应地去除未标记的异常值,并通过两种新的面向头部的强增强技术进一步提高 - 潜在嵌入聚类算法用于鲁棒性遮挡下的头部姿态估计
本文提出了一个新颖而高效的框架,通过无监督的潜在嵌入聚类与回归和分类组件来优化遮挡和非遮挡图像的潜在特征表示,并改善细粒度角度预测,在野外头部姿势数据集上得到了与最先进方法相当的竞争性能,并具有显著的数据减少优势。我们观察到遮挡头部姿势估计 - 全角度头部姿态估计的数学基础和改正方法
该论文通过对数据集、头部姿态估计算法和绘制例程的深入研究,提出了从提供的源代码推断坐标系、应用顺序和提取精确旋转矩阵和欧拉角的代码和算法,以及将姿态从一个旋转系统转换到另一个旋转系统的代码和算法,2D 旋转矩阵的新公式,以及旋转矩阵和姿态的 - 基于位置引导的鱼眼图像头部姿态估计
使用鱼眼镜头进行头部姿态估计,提出了一种新的方法,通过图像中头部位置的知识来降低鱼眼畸变的负面影响,使用卷积神经网络从鱼眼图像直接估计头部姿态,无需校正或标定操作,实验证明与其他最先进的单阶段和双阶段方法相比,我们的网络显著提高了头部姿态估 - 关于宽广与短程头部姿态估计的表征和方法学
在计算机视觉中,头部姿态估计是一个感兴趣的问题,旨在改善半正面或侧面设置下面部处理任务的性能。本文分析了短距离和长距离头部姿态估计的方法,并讨论了每种情况下适合的表示和度量标准。同时提出了一个量化训练和测试数据集之间不一致性的方法,并基于 - 基于外观的注视估计,使用深度神经网络增强的合成图像
使用人工神经网络建立了一个模块化系统,通过对分别裁剪的眼睛进行估计,利用人脸检测和头部姿势估计组件,无需特殊硬件或红外滤光片,仅使用内置 RGB 相机进行人眼注视估计,通过包含大量合成数据集在训练模型中,达到了比相关方法更高的准确度。
- 二维图像头部姿势估计的遮挡环境下的潜空间回归
提出了一种新的深度学习方法,用于处理遮挡下的头部姿态估计问题,该方法通过潜在空间回归来更好地解决遮挡场景下的问题,实现了超越多种当前最先进遮挡下头部姿态估计方法的性能,并在非遮挡场景下达到了类似的准确度。
- 面部、面部特征点和头部姿态联合检测的实时多任务学习系统
该论文提出了一个实时多任务检测系统,能同时执行面部、面部标志和头部姿势的联合检测,以处理大角度面部姿势挑战,并在多个数据集上验证了其实时性能和有效性。
- 面向稳健和无约束全旋转角度头部姿态估计
使用旋转矩阵法进行端到端的头部姿态预测,通过引入连续 6D 旋转矩阵表示法和地理损失方法来有效学习头部旋转外观并克服当前最先进方法的限制,从而大幅提高头部姿态预测的范围和稳定性。
- CVPRUnimodal-Concentrated Loss: 用于序列回归的全自适应标签分布学习
通过三个原则,我们提出了一种全面自适应的标签分布学习方法,称为单峰浓缩损失方法,它使用学习排序策略获得单峰分布,并将估计误差和预测分布的方差集成到损失中,具有在年龄和头部姿态估计等回归任务上表现优越的结果。
- LwPosr:轻量高效的细粒度头部姿态估计
本文提出了一种基于深度可分离卷积和变换器编码器层结构的两个流和三个阶段的轻量级网络 LwPose,用于头部姿势估计 (HPE) 任务,与此前的方法相比,该方法具有更高的效率和更小的空间要求,适用于移动设备。
- 野外多任务头部姿态估计
通过深度学习的多任务方法,提出了一种可以同时处理头部姿势、人脸对准和可见性的网络结构,相比现有技术,在头部姿势和可见性方面均取得了最佳表现,在人脸对准方面也达到了和现有技术同等的状态。
- CVPRASMNet:一个轻量级的用于脸部对齐和姿态估计的深度神经网络
本文提出了一种轻量级卷积神经网络架构,使用 Active Shape Model 辅助 loss function 进行面部对齐和估计头部姿态,该方法在人脸特征点检测和面部姿态估计任务中取得了与 MobileNetV2 相当甚至更好的表现, - 增强头部姿态估计的基于向量的表示
本文提出使用旋转矩阵中的三个向量作为头部姿态估计的表示并基于此开发了一种新的神经网络。作者解决了当前头部姿态估计存在的两个问题:注释数据样本时欧拉角或四元数的不连续性问题,以及 Mean Absolute Error(MAE)不能准确反映头 - ECCV自适应深度回归森林在考虑样本不平衡情况下的应用
本文提出了一种新的自我定步深度回归森林模型(SPUDRFs)解决深度识别模型中的排序和选择问题,在人脸年龄估计和头部姿势估计等视觉任务中实现了最先进的表现。
- 面部闭塞下的同时人脸特征点检测、姿态和变形估计
提出了一种基于模型的联合框架,用于同时进行面部标志检测,头部姿态估计和面部变形分析。
- ICCV基于推荐树的任意视角人脸对齐
通过学习使用建议树的集成,本文针对人脸对齐中面临的多视角和标记协议等问题提出了解决方案,并在包含前瞻和侧视脸的多个数据集中得到了最新的性能表现。
- 利用头部姿态估计辅助人脸对齐
本文提出了一种基于显式头部姿态估计的级联人脸对齐的监督初始化方案,在 300W 数据集上表现出很高的性能。