PAUL: 无监督提升的普科鲁斯特自编码器
介绍了一种新的 3D 表面基础的物体类别生成模型 - Lifting Autoencoders,该模型结合了非刚性结构运动、图像形成和形态模型等的思想,能完全无监督地从非结构化的图像集中学习可控、几何的 3D 类别生成模型,并使用可微渲染器生成 RGB 图像和对抗性训练的细化网络实现清晰逼真的图像重建结果。其生成模型可以通过可识别的几何和外观因素进行控制,从而进行身份、表达、3D 姿势和光照属性的逼真图像操作。
Apr, 2019
提出了一种新的神经网络训练框架,可以在只有 2D 注释的情况下学习非刚性物体的 3D 信息,该框架通过自动确定适当的旋转解决了非刚性结构运动估计中同时估计旋转和变形的难点,使用损失函数进行训练后,网络可以学习人类骨架和面孔等对象的 3D 结构,在测试过程中可以处理带有丢失入口的输入,实验证明该框架表现优异,即使底层网络结构非常简单,在 Human 3.6M、300-VW 和 SURREAL 数据集上均优于现有最先进的方法。
Jul, 2020
本文提出了一种基于深度神经网络和稀疏编码模型的新型非刚性运动结构重建方法,通过模型区分位姿和三维结构,解决了先前算法在图片数量和形状可变性方面的局限性,在视觉领域的应用得到了显著的提升。
Jul, 2019
本文提出了一种基于深度神经网络的非刚性运动结构恢复方法,该方法在订单级别上表现出比所有现有技术更出色的精度和鲁棒性,能够处理规模和形状复杂度前所未有的问题,并提出了一种基于网络权重的质量度量来评估重建可信度。
Jul, 2019
从时空建模的角度解决非刚性结构从动(NRSfM)中的关键挑战,包括运动 / 旋转的歧义、基于全局形状的低秩模型对 3D 形状序列的变形处理问题。通过引入新的临时平滑的 Procrustean 对齐模块和自适应的空间加权方法,提出了一种更好的非刚性结构建模方法,模型效果超过现有的以低秩为基础的方法。
May, 2024
本文提出了一种新的人体姿势变形建模方法,并设计了一种基于扩散的运动先验。通过非刚性运动结构重建 3D 人体骨骼的任务分为估计 3D 参考骨架和逐帧骨架变形。同时使用混合时空 NRSfMformer 从 2D 观察序列中估计每一帧的 3D 参考骨架和骨架变形,并将它们相加得到每一帧的姿势。最后,使用基于扩散模型的损失项确保管道学习正确的先验运动知识。最终,在主流数据集上评估了提出的方法,并获得了优于现有技术的结果。
Aug, 2023
最近开发的降阶建模技术旨在从数据中学习的低维流形上近似非线性动力系统。我们介绍了一种由约束的自动编码器神经网络描述的参数化非线性投影类,其中流形和投影纤维都是从数据中学习得到的。此外,我们还提出了一些新的动力学感知成本函数,以促进学习考虑快速动力学和非正常性的斜投影纤维。为了展示这些方法及其解决的特定挑战,我们提供了一个关于涡街现象的三状态模型的详细案例研究。同时,我们还提出了几种基于我们提出的非线性投影框架构建计算高效的降阶模型的技术。这包括一种用于避免计算 Grassmann 流形上有害的权重矩阵收缩的新型稀疏促进惩罚项的编码器。
Jul, 2023
本研究提出基于非刚性结构运动学 (NRSfM) 知识蒸馏的三维姿态估计方法,它仅使用 2D 地标注释而不需要 3D 数据、多视角 / 时间镜头或对象特定先验,从而减轻了监督方法中的数据瓶颈。该方法使用一种新颖的损失,将深度预测与 NRSfM 中使用的代价函数联系起来,从而使学生姿态估计器能够通过与图像特征关联来减少深度误差。在 H3.6M 数据集上验证,我们学习的三维姿态估计网络实现了比 NRSfM 方法更准确的重建,并且在使用更少的监督的情况下表现比其他弱监督方法更好。
Aug, 2019
本论文提出了一个自监督学习的视频自编码器,能够从视频中学习出 3D 结构和相机姿态的解耦表示,通过重组这些表示来实现诸如新视角合成、相机姿态估计以及运动跟踪的任务。
Oct, 2021