- DPoser: 扩散模型作为稳健的三维人体姿势先验
DPoser 是一种基于扩散模型的强大而多功能的人体姿势先验,它在包括人体网格恢复、姿势完成和动作降噪在内的各种姿势中心应用中无缝集成,并通过采用变分扩散采样进行有效求解,它在多个任务中展示了其优越性。
- 基于时间感知的视频人体姿态与形状恢复的改进
通过提出一个 Temporal-Aware Refining Network (TAR),本文探索了对于精确的姿势和形状恢复而言的全局和局部图像特征的时间感知,实现了比现有方法更准确的结果。
- 通过对抗训练的分解人体动作先验用于视频姿态估计
通过将运动先验以对抗的方式整合进来,本文针对神经网络模型在人体姿态回归中要求对身体运动先验的作用进行了探索和研究,并证明了该算法在 3D 领域中具有较高的鲁棒性和准确性。
- 单张图像人体网格重建误差估计
该研究提出了一种人体姿势和形状预测模型,可以识别不可靠的预测区域,特别适用于人机交互领域。
- CVPRHuManiFlow: 在 SO (3) 流形上,对祖先进行调整的正则化流,用于人类姿势和形状分布估计
本文介绍了一种名为 HuManiFlow 的方法,利用概率分布和正规化流预测 3D 人体姿态和形状,同时具备准确性、一致性和多样性,解决了估计不明确的问题。
- 理解基于姿态的异常检测的挑战与机会
本研究对两个视频异常数据集进行了分析和定量化,以更好地理解基于姿势的异常检测的困难之处,并探索了基于姿势和轨迹的区别能力以及基于上下文的有效性,从而加速更好性能、更具鲁棒性的模型的开发。
- 基于正则流模型的人体姿态异常检测
本研究通过将视频异常检测问题简化为人体姿势的异常检测,使用一种基于 spatio-temporal graph convolution blocks 的基于正常化流的算法来处理这类数据,并在两个异常检测基准数据集上表现出最先进的结果。
- ECCV在电视节目中重建三维人物和环境
本文提出在整个节目季度中聚合三维信息以进行电视剧的三维重建,该信息作为丰富的三维上下文可用于指导和改善这些环境中的三维人体姿势和位置恢复,并展示了 3D 推理不仅能够应用于重新识别和注视估计,还可以应用于电影摄影与图像编辑等各种应用领域。
- ECCV基于几何特征的视频多人物体交互识别
本研究提出一种基于几何特征的图卷积网络用于人 - 物交互识别,结合了人体姿态和物体位置等几何要素与视觉特征,在多人和多物体的情况下显著提高了识别准确率,并构建了新的多人人 - 物交互数据集 MPHOI-72。
- 仿生场景生成
利用一个大规模的生成对抗网络,驱动人体姿态和场景之间微妙的关系,使得该网络能够产生出提供逼真姿态信息的虚拟场景。此网络在复杂度和大小方面均超过了 StyleGAN2,并能在各种场景下使用,例如生成带有人体姿态的场景,提升照片质量等。
- ICCV少样本、细粒度运动动作识别视频姿态蒸馏
研究了利用视频行为识别任务中的人体姿态,介绍了 Video Pose Distillation (VPD) 弱监督技术来学习新视频领域的特征。其在不需要额外的人体姿态注释的情况下,在四个真实世界的体育视频数据集上提高了人体动作识别、检索和检 - LASOR: 通过合成有遮挡感知数据和神经网格渲染学习精确的三维人体姿态和形状
针对人体姿态和形状估计中的遮挡问题,特别是人物之间的遮挡问题,本文提出了一种新的框架,通过合成 occlusion-aware 阴影和 2D 关键点方便估计 SMPL 姿态和形状参数,使用三维神经网格渲染器实现了实时新学习,已在现有数据集中 - 基于归一化流的弱监督 3D 人体姿态和形状重建
本文提出了一种基于运动捕捉数据集和大规模图像和视频数据集的半监督和自监督学习方法,利用运动和不同 iable 的语义身体部位对齐损失函数进行训练,来精确地估计单眼三维人体姿态和形状。实验结果证明,该方法优于现有技术,可用于广泛的真实场景。
- PoseLifter:从单个嘈杂的 2D 人体姿势获取绝对 3D 人体姿势提升网络
提出一种新的网络 (PoseLifter),可以将 2D 人体姿势提升为绝对 3D 姿势,并通过合成真实误差分布的 2D 姿势,应用于公共数据集,取得了最先进的 2D 到 3D 姿态提升和 3D 人体姿态估计结果。
- ICCVTRB:一种用于理解 2D 人体的新型三元组表示
本篇论文提出了三重体表示 (TRB)—— 一种紧凑的 2D 人体表示法,它包括捕捉人体姿态信息的骨架关键点和包含人体外形信息的轮廓关键点,以及旨在解决 TRB 估计问题的两个支路网络(TRB-net),以及 X 结构,定向卷积和配对映射这三 - KDD使用深度生成模型进行姿势引导的时尚图像合成
本文提出了一种基于新颖的深度生成模型的图像迁移方法,可以在保持服装一致的情况下将一个人的图像从一个给定的姿势转移至一个新的姿势,使用图像编码器、姿势编码器和解码器的结构,同时利用两个鉴别器来指导产生过程。经过严格的实验,在两个数据集上定量和 - 物件作为点
本文提出了一种基于中心点检测的方法,该方法使用关键点估计来找到物体的中心点,并回归到所有其他物体属性,例如大小,3D 位置,方向和姿态,实现了较好的速度和精度。
- ECCV姿势引导的人体视频生成
本文提出了一种基于姿态引导的方法来以可分离的方式合成人类视频:可信的运动预测和协调的外观生成,旨在探索并掌握视频合成中人体姿态的本质动态和诠释能力,并在保持外观连贯性的同时处理异常和嘈杂数据,实验证明其优于现有技术。
- Pose2Seg: 无检测人体实例分割
本篇论文提出了一种基于人体姿态的实例分割框架,相比于传统的基于 proposal 区域检测的方法,可以更准确地分割出人体,而且对于遮挡更具有鲁棒性。此外,作者还介绍了一个新的基于遮挡人体的公共数据集 OCHuman,包含了 8110 个被详 - ECCV人体姿态估计的多尺度结构感知网络
本文提出了一种多尺度结构感知神经网络,通过多尺度监督、多尺度回归网络、中间监督和结构感知损失以及关键点掩蔽训练方案等四个方面对深度卷积 - 反卷积沙漏模型进行改进,以有效地提高人体姿势估计的性能。该网络不仅可以解决尺度差异、遮挡和复杂多人场