自主驾驶中基于运动的无监督感知与预测

ECCVOct, 2022

自主驾驶中基于运动的无监督感知与预测

Motion Inspired Unsupervised Perception and Prediction in Autonomous Driving

Mahyar Najibi, Jingwei Ji, Yin Zhou, Charles R. Qi, Xinchen Yan...

TL;DR本文提出一种使用自学生成流技术的框架，自动学习行驶中的自由运动的物体，以替代在自主驾驶系统中昂贵的人工标注，实现更广泛、准确、自主的交通参与者识别和动作预测。

Abstract

Learning-based perception and prediction modules in modern autonomous driving systems typically rely on expensive human annotation and are designed to perceive only a handful of predefined object categories. This closed-set paradigm is insufficient for the safety-critical →

autonomous driving perception module prediction models open-set moving objects self-learned flow

发现论文，激发创造

自动驾驶中的无监督 3D 感知与 2D 视觉语言蒸馏

本文介绍了一种多模态自动标注流程，可以生成用于训练开放式类别的无标注 3D 边界框和轨迹，从而处理自动驾驶等安全关键应用中可能在部署后遇到的新物体类型。相比于当前领域的最新研究，我们的方法可以以无监督的方式处理静态和移动的对象，并通过提出的视觉 - 语言知识蒸馏方法输出开放式词汇的语义标签。基于 Waymo 开放数据集的实验证明，我们的方法在各种无监督 3D 感知任务上显著优于先前的工作。

Sep, 2023

自主驾驶的自监督支柱运动学习

本文提出了一种基于点云数据和自监督学习的动态估计框架，旨在高效精确地估计自动驾驶汽车与其他动态交通参与者的相对运动状态，并在实验中表现出与有监督方法相当的竞争力。

Apr, 2021

跟随视觉流动：自监督场景光流估计

本文介绍了一种使用自我监督的技术，基于最近邻和循环一致性，来训练场景流模型，从而解决在自动驾驶过程中对高动态环境的非刚性物体移动的计算问题，并且其性能优于当前标注了实际场景流数据的最新的有监督学习方法.

Dec, 2019

将视觉与运动联系起来，实现自监督的以物为中心的感知

本研究采用自监督的物体中心视觉模型，只使用 RGB 视频和车辆姿态作为输入，实现了物体分解，并在 Waymo 开放感知数据集上展示了正面的结果。

Jul, 2023

面向自动驾驶的大规模交互式运动预测：Waymo 开放运动数据集

该研究介绍了当前最全面的交互式动作数据集，包含超过 100,000 个场景，用于发展动作规划模型与提供强大的基线模型来对单独或多个交互式对象进行预测，并提供了新的度量方法。

Apr, 2021

面向分布感知的自主驾驶安全目标预测和符合模型规划

本文提出了一种基于模块化架构的学车任务分解方法，在障碍感知、目标预测和规划方面均取得了优秀的方法，并在 CARLA 模拟器上实现了最新的优秀结果。

Dec, 2022

发现可移动的物体

本文针对对象发现这一问题，通过选择动态对象并使用自编码器提取图像特征并加入来自运动分割的弱学习信号，成功地从复杂场景中分离出运动和静止的动态对象，相较于其它抽象特征的方法在 KITTI 数据集上有更好的表现。

Mar, 2022

具有空间和时间一致性约束的自监督非特定类别运动预测

无标签 LiDAR 点云的自监督运动预测方法证明在运动行为感知、自动驾驶等领域中表现出显著的优势。

Mar, 2024

视频中的自监督物体运动和深度估计

本文提出了一种自监督学习框架，从视频中估算单个对象的运动和单眼深度，并将对象运动建模为六个自由度刚体变换；此外，该方法还使用实例分割掩码引入对象信息，并通过引入新的几何约束损失项消除运动预测的尺度歧义，实验结果表明，该框架在不需要外部注释的情况下处理数据并能够捕捉对象的运动，与自监督研究方法相比，在 3D 场景流预测方面有更好的表现，对动态区域的视差预测也有所贡献。

Dec, 2019

条件运动传递的自监督学习

本篇研究提出了一种新的基于条件运动传播和稀疏光流技术的自监督学习范式，能够有效地学习视觉表征，并在语义分割、实例分割以及人体解析等多个任务上实现最先进的自监督学习表现，还能实现半自动像素级标注。

Mar, 2019