野外多视角引导学习

Oct, 2022

MBW: Multi-view Bootstrapping in the Wild

Mosam Dabhi, Chaoyang Wang, Tim Clifford, Laszlo Attila Jeni, Ian R. Fasel...

TL;DR本文提出了使用非刚性 3D 神经先验结合深流技术从仅有两到三个非标定手持相机的视频中获取高保真的地标估计，只需少量人工标注便可达到与全监督方法相当的 2D 结果，以及其他现有方法不可能实现的 3D 重建。

Abstract

Labeling articulated objects in unconstrained settings have a wide variety of applications including entertainment, neuroscience, psychology, ethology, and many fields of medicine. Large offline labeled datasets do not exist for all but the most common articulated object categories (e.g., humans). Hand labeling these landmarks within a video sequence is a la

landmark detection multi-camera systems 3d neural prior uncalibrated cameras video annotation

发现论文，激发创造

野外多视角图像下的弱监督 3D 人体姿态学习

本文提出一种基于弱监督方式，利用多视角数据进行 3D 人体姿势估计的学习框架，包括利用 2.5D 表示法的目标函数，经过测试在两个大规模数据集上达到了半监督 / 弱监督方法的最佳表现。

Mar, 2020

面向可泛化人工智能的无标注多视角三维行人检测：技术和性能分析

利用通用化人工智能改进无标签目标场景的多视角 3D 行人检测，通过使用未经训练的检测器的自动标注方法，可以获得比直接使用未经训练检测器或使用现有标记的源数据集训练的检测器更好的结果。在使用 WILDTRACK 和 MultiviewX 作为目标数据集时，MODA 比现有的无标签方法分别提高了 4% 和 1%。

Aug, 2023

从野外视频中学习手持物体重建

本文介绍了一种通过采用从野外视频数据中提取的三维监督来重建手持物体的方法，并使用数据驱动的三维形状先验进行训练，结果表明这种间接的三维监督信号可以在没有直接现实世界三维监督的情况下有效地预测真实世界中的手持物体的三维形状。

May, 2023

野外无监督单目 3D 人体姿态估计 CanonPose

本文提出了一种自我监督的方法，利用未标注的多视角数据学习单图像三维姿态估计器，通过多视角一致性约束将观察到的二维姿态分离成基础的三维姿态和相机旋转，并且提出了新的、无偏的重建目标函数，跨视角和训练样本混合信息。该方法在两个基准数据集（Human3.6M 和 MPII-INF-3DHP）和野外 SkiPose 数据集上进行了评估。

Nov, 2020

利用多视角引导的单张图像手部关键点检测

该研究提出了一种利用多相机系统训练微粒子探测器的方法，采用多视角几何或标记为异常值对噪声标签进行三角测量来改善探测器，从而实现单幅图像的手指关键点检测，并使该技术成为实现具有复杂对象交互的无标记 3D 手部动作捕捉的解决方案。

Apr, 2017

从网络图像中使用关键点伪标签学习关节点姿态

本文提出了一种可以利用少量标记为二维关键点的图片进行单目三维建模的方法，包括训练类别特定的关键点估计器、在未标记的网络图像上生成二维关键点伪标记和利用标记和自标记集合共同训练三维重建模型等步骤，实现了对多个复杂物体的三维重建，可以迅速启动模型且易于适应新的物体种类。

Apr, 2023

野外单目三维人体姿态估计的普适性推广

研究人员提出了一种基于立体视觉启发的神经网络技术和几何搜索方案来生成高质量的 3D 姿势地面真实数据，使不需要专业训练模式和辅助损失函数的神经网络模型在野外图像数据中实现良好的 3D 姿态估计结果。

Apr, 2019

从多视角图像学习单目三维人体姿态估计

本文提出了一种通过多视角的训练，使用一致性约束联合监督损失及惩罚项实现替代大量标注的 3D 人体姿态估计方法，并提出了一种联合估计相机姿态及人体姿态的方法，在 3D 人体姿态估计方面取得了良好的表现。

Mar, 2018

利用未标记视频对来自未见过的类别的对象进行更好的分割学习

本文探索使用未标注的视频序列自动生成未知类别对象的训练数据，介绍了一种基于贝叶斯方法的自动创建训练集的方法，并通过实验证明其能够显著提高分割未知类别对象的性能，从而可以利用丰富的互联网视频实现开放世界的实例分割。

Apr, 2021

自动驾驶中的无监督 3D 感知与 2D 视觉语言蒸馏

本文介绍了一种多模态自动标注流程，可以生成用于训练开放式类别的无标注 3D 边界框和轨迹，从而处理自动驾驶等安全关键应用中可能在部署后遇到的新物体类型。相比于当前领域的最新研究，我们的方法可以以无监督的方式处理静态和移动的对象，并通过提出的视觉 - 语言知识蒸馏方法输出开放式词汇的语义标签。基于 Waymo 开放数据集的实验证明，我们的方法在各种无监督 3D 感知任务上显著优于先前的工作。

Sep, 2023