本研究提出了一种基于分数热力图回归的高分辨率视频人脸对齐方法,该方法可以准确估计热图中的分数部分,并提出了一个新的稳定损失来解决时间延迟和非平滑问题。实验证明,该方法的精度和稳定性优于现有的方法。
Nov, 2018
该论文提出了适应性翼形损失函数和加权损失映射以及其他一些方法,用于提高热图回归定位面部关键点的准确性,并在不同的基准测试中显著优于现有方法。
Apr, 2019
本文提出了 Pixel-in-Pixel Net(PIPNet) 对面部关键点检测的改进方法,旨在解决热图回归模型在计算效率、全局模型约束和域差异等方面的问题。实验表明,该模型在三个受监督学习的基准测试中均具有最先进的表现,而在两个跨领域测试集上的结果也得到了明显改善。同时,PIPNet 的轻量级版本在 CPU 和 GPU 上分别以 35.7 和 200 FPS 的速度运行,仍然保持了与最先进方法的竞争精度。
Mar, 2020
本论文提出了一种监督学习方法,同时实现面部动作单位(AU)的本地化和强度估计,通过热图回归直接和联合估计所有 AU 强度和其可能导致可见变化的面部位置,旨在学习每 AU 的每个空间位置的得分。在 BP4D 数据集中,该方法取得了最新技术水平,同时对位移误差具有稳健性。
May, 2018
本文提出了一种基于半监督学习的方法,其思想是通过无监督学习生成脸部特征并使用转移学习的方式实现面部特征检测,该模型表现出广泛的适应性和高精度,并且在只有十个训练图片的情况下也能保持较高的准确率。
Nov, 2019
通过使用来自红外图像的热图像,利用人脸的重要区域进行面部标志跟踪,忽略了光照和阴影,但显示了主体的温度,通过特定位置上的热量波动反映生理变化,如血液流动和出汗,用于远程判断焦虑和兴奋。本研究进一步尝试了各种模型,包括残差连接、通道和特征关注以及网络组件的并行运作,最佳模型整合了卷积和残差层以及通道自注意层,只需要不到 100,000 个参数。
Nov, 2023
本文提出一种基于自动编码器的方法,无需监督信号,从而学习图像模型中的对象结构,发现了与手动注释地标更为相关的语义有意义的地标,这些地标是识别视觉属性的补充特征,并且自然地创建了一个无监督、可感知的界面,用于操纵对象形状和解码具有可控结构的图像。
Apr, 2018
本研究利用卷积神经网络进行人体姿态估计,通过利用关系和空间上下文,提出了一种特殊的 CNN 级联架构,并能够在部分遮挡的情况下,鲁棒地推断姿势,该级联架构能够指导网络集中精力在图像的哪个位置,并明确编码部分限制和上下文约束,并能够应对遮挡。我们的级联结构表现出色,能够在 MPII 和 LSP 数据集上取得最佳的表现。
Sep, 2016
本文研究基于 heatmap 的人体姿态估计中的坐标表示方法,并提出了一种更为合理和有效的分布感知解码方法和准确的 heatmap 分布生成方法,最终提出了一种名为 DARK 的新型坐标表示方法,并在 MPII 和 COCO 等基准测试上获得最佳结果,提高了各种最新人体姿态估计模型的性能。
Oct, 2019
本文介绍了一种使用级联 Transformer 的基于回归的姿势识别方法,利用编码器 - 解码器结构实现了人体和关键点检测的回归,通过不同自注意力层中的关键点假设改进来展示了 Transformer 中的递归自注意力机制,并与竞争的回归方法进行比较得到了有竞争力的结果。
Apr, 2021