CrowdRec: 单色图像的 3D 众人重建
本文提出了 Crowd3D 框架,用于从单个广角场景图像中重建数百人的三维姿态、形状和位置,该方法基于新定义的 Human-scene Virtual Interaction Point(HVIP)的像素定位来解决复杂场景中的人群定位问题,并使用 adaptive human-centric cropping 方案进行处理,同时贡献了一组用于场景人群重建的基准数据集 LargeCrowd。
Jan, 2023
该研究论文提出了一种名为 3DCrowdNet 的深度学习模型,利用 2D 人体姿态估计和基于关节回归的方法,从拥挤的实景图像中恢复出单个人的三维人体模型。
Apr, 2021
本研究提出了一种新的端到端学习框架,可以从一张图像中获取多人的详细且具有空间连续性的重建,并能解决多人姿态、遮挡、衣着等问题带来的困难,实现了对穿衣人体在任意姿势下的模型自由_implcicit 3D 重建和同步估计。针对模型和数据集,实验结果表明,该方法与现有的竞争方法相比,具有更高的精度和完整性,呈现了最先进的性能。
Apr, 2021
本篇文章调查了单目三维人体网格恢复的相关任务,包括身体模型,恢复框架 / 训练目标,数据集评估指标和评测结果,并从优势和劣势方面深入分析了两种范式:优化和回归。作者希望激励研究人员的兴趣,促进该领域的研究。
Mar, 2022
本文提出了一种基于学习的模型,利用少量单目视频帧 (1-8 帧) 从移动的人中推断出其个性化的 3D 形状,可在不到 10 秒内达到 5mm 的重建精度。该模型学习预测一个统计体型模型的参数和实例化偏移量,同时加入衣服和头发的形状,具有快速和准确的预测,这得益于其对 T-pose 空间的预测和从上往下和从下往上两个视图预测的结合。该模型仅基于合成的 3D 数据进行学习,可将可变数量的帧作为输入,即使仅有一张图像,也能以 6mm 的精度重建形状。3 个不同数据集的结果表明了本方法的有效性和准确性。
Mar, 2019
该论文提出了一种基于卷积神经网络的直接预测方法,将参数化的统计全身形状模型与 2D 关键点和掩膜相结合,实现从单张彩色图像中估计全身的 3D 姿态和形状,得到了比先前基准更好的结果。
May, 2018
提出了一种基于 CNN 的方法,利用现有的 3D 姿势数据和 2D 姿势数据进行迁移学习,在真实场景中实现了最先进的性能,同时引入了一个人类身体姿势估计的新训练集,并提出了一个覆盖室内和室外场景的新基准。
Nov, 2016
在大规模拥挤场景中,针对相互遮挡、严重尺度变化和复杂的空间分布等问题,通过充分利用人群特征从单目图像中重建人群,该研究提出了一种新颖的超图关系推理网络,用于建立人与群体之间的复杂和高阶关系相关性。实验结果表明,该方法在拥挤和常见场景中均优于其他基线方法。
Aug, 2023
本文提出使用卷积神经网络和编码器 - 解码器神经网络从单张彩色图像中直接回归 3D 人体网格,利用高效的 3D 人体形状和姿势表示方法,在 Human3.6M、SURREAL 和 UP-3D 等多个 3D 人体数据集上实现了最新性能。
Mar, 2019
本文提出了一种端到端可训练模型,以单个 RGB 图像感知 3D 场景,估计相机姿态和室内布局,并重建人体和物体网格。通过对所有估计方面施加全面而复杂的损失,我们证明了我们的模型优于现有的人体网格方法和室内场景重建方法。据我们所知,这是第一个在网格级别输出对象和人体预测,并对场景和人体姿态进行联合优化的模型。
Dec, 2020