视频人体姿势估计的流动卷积神经网络
本文提出了一种新颖的 ConvNet 模型,可预测图像中的 2D 人体姿势,通过回归每个关键点的热度图表示,并能够学习和表示部件外观和配置上下文。模型可以从头开始和端到端训练,用于改善性能的辅助损失。该模型在两个基准数据集上进行了评估,具有与最先进技术相当的性能,但不含有图形模型阶段(或层)的复杂性。
May, 2016
本文提出了一种新的基于卷积神经网络的人体姿势估计的架构和改进的学习技术,能够学习底层特征和高级弱空间模型,在姿态估计中比现有传统架构实现了显著改善。同时,本文探讨了一些研究中发现的经验教训,表明在一些情况下,甚至仅涵盖图像中的几个像素的特征检测器也可以产生出强的特征检测结果,并且高级空间模型对姿势估计的改善效果相对较小。本文的主要贡献在于展示了一种特定变体的深度学习可以在该任务上胜过所有现有传统架构。
Dec, 2013
该研究提出了一种个性化 ConvNet 姿态估计器,它可以根据帧与帧之间的时间跨度和人物外貌的特点,在视频中生成高精度的姿态标注,并利用自评模型筛选高质量的标注,并通过自动化的 fine-tune 训练方法将其个性化,相比于通用的 ConvNet,对目标视频的姿态估计得到了大幅提升,表现比现有方法更好。
Nov, 2015
本研究利用卷积神经网络进行人体姿态估计,通过利用关系和空间上下文,提出了一种特殊的 CNN 级联架构,并能够在部分遮挡的情况下,鲁棒地推断姿势,该级联架构能够指导网络集中精力在图像的哪个位置,并明确编码部分限制和上下文约束,并能够应对遮挡。我们的级联结构表现出色,能够在 MPII 和 LSP 数据集上取得最佳的表现。
Sep, 2016
本文提出了一种卷积神经网络用于从视频中提取密集的光流,旨在为深度架构构建潜在的模块,以允许在视频中使用运动而无需借助外部算法,通过考虑信号处理原则构建网络结构,强制 “旋转不变性”,并提供一种分布式表示运动的方法。
Jan, 2016
本文提出卷积神经网络模型,将光流估计问题作为监督式学习任务,通过生成合成数据集进行训练,成功实现在计算机视觉领域特别是识别任务中广泛应用的卷积神经网络模型在光流估计任务上的成功率。
Apr, 2015
本文提出了一种基于多帧和时序信息的人体姿态估计方法。该方法包含三个模块:姿态时序合成器、姿态残差融合模块和姿态校正网络。在 PoseTrack2017 和 PoseTrack2018 数据集上进行的实验结果表明,该方法取得了最佳效果,并已发布代码以期促进未来的研究。
Mar, 2021
本文提出了一种深度结构模型,用于在不受限制的视频中预测人体姿态序列,借助于深度卷积神经网络、时间信息和领域知识,该模型能够同时表示身体关节的外观和它们的时空关系,并有效约束骨骼结构和强制时间一致性。在两个广泛使用的基准测试数据集上评估该架构,取得了比现有最先进方法更好的性能表现。
Mar, 2017