无监督学习基于物体为中心的视频中的类别级三维姿态
该论文提出了一种用于物体识别和3D姿态估计的描述符计算方法,利用卷积神经网络计算描述符并通过简单的相似性和差异性约束训练,使不同对象和不同视角下的图像聚类成互相分离的簇,从而在各种数据下超越了现有的物体视图表现。
Feb, 2015
本文提出使用多视角图像而无需注释,来学习一个具有几何感知能力的身体表示,通过使用该身体表示,我们的方法在仅使用少量标记数据的情况下,显著优于完全监督的方法,并且在使用仅 1% 标记数据时,也优于其他半监督方法。
Apr, 2018
该研究使用卷积神经网络训练能够从单个图像预测出物体的3D形状和相机姿态的模型,并通过一组pose预测器进行姿势模糊处理,并利用可微分3D点云投影技术来获取高保真度的形状模型。
Oct, 2018
我们提出了一种完全通用的深度姿态估计方法,通过动态条件姿态估计和目标物体的3D模型表示相结合,能够对不属于预定义类别的自然实体进行训练并将其推广到全新类型的3D对象。
Jun, 2019
本文提出了一个基于神经网络视图合成和匹配的学习框架,通过生成的伪标签来学习众多未标注图像中的物体3D姿态估计,同时结合 EM 算法的方式,逐步提高特征提取器在不同3D视角下的不变性,并通过在 PASCAL3D+ 和 KITTI 数据集上进行的实验证明,该方法在少样本学习下,尤其是掩盖度极高的情况下,比其他基线方法表现更好,且具有出色的鲁棒性。
Oct, 2021
该研究提出了一种基于单个对象检查实现类别级姿态估计的方法,通过利用多视角对应关系从而为未见过的对象的姿势估计提供更精确的结果,并展示了该方法在连续学习环境下的应用。
May, 2023
3DUDA是一种适应无关3D或深度数据的干扰严重的目标领域的方法,通过对物体的不变子组件进行策略性利用,迭代更新本地鲁棒的网格顶点特征并改进姿态估计准确度,以解决领域转移挑战。
Jan, 2024
提出了一种不需要姿态标注的类别级三维物体姿态估计方法,通过使用扩散模型生成一组具有姿态差异的图像,并利用图像编码器和新颖的学习策略解决噪声和伪影问题,实现了从单次拍摄中对类别级物体姿态的估计,并在少样本类别级物体姿态估计基准上显著优于其他先进方法。
Apr, 2024
本研究解决了类别层级关节物体姿态估计中,未知关节物体变化多端形状和姿态的问题。我们提出了一种利用单帧点云的自监督方法,能够生成规范姿态的重建,并有效减少整体姿态方差,同时实现各部分与重建部分的对齐。实验结果表明,该方法显著优于以往的自监督方法,并在真实世界场景中具有良好表现。
Aug, 2024