用于以视觉为中心的自动驾驶的中间 3D 特征调节

AAAIDec, 2023

用于以视觉为中心的自动驾驶的中间 3D 特征调节

Regulating Intermediate 3D Features for Vision-Centric Autonomous Driving

Junkai Xu, Liang Peng, Haoran Cheng, Linxuan Xia, Qi Zhou...

TL;DRVampire 通过体积渲染在多摄像头感知任务中调控中间密集的 3D 特征，并在各种下游感知任务中展现出与现有最先进方法相竞争的能力。

Abstract

multi-camera perception tasks have gained significant attention in the field of autonomous driving. However, existing frameworks based on Lift-Splat-Shoot (LSS) in the multi-camera setting cannot produce suitable dense

multi-camera perception dense 3d features volume rendering perception tasks vampire

发现论文，激发创造

使用带引导的稀疏特征体积融合从单目视频中增量稠密重建

本文提出了基于特征体积的实时密集重建方法，采用稀疏的深度特征体积来预测 TSDF 值，通过多视角图像聚合细节信息进行时序融合，实现了比以往更高分辨率和更完整细节的三维几何图形重建，其在室内和室外场景中都比现有的方法具有更好的实时重建性能。

May, 2023

PV-SSD：基于投影和体素的双分支单阶段三维目标检测器

该论文介绍了一种基于体元和投影双分支特征提取的 3D 目标检测器，以解决信息丢失的问题。通过融合具有丰富局部语义信息的体元特征和投影特征，该方法在特征提取阶段减少了由投影引起的局部信息丢失，并在比较实验中取得了良好的性能。

Aug, 2023

多视图重建中通过体渲染学习拓扑统一的人脸网格

我们提出了一种面向多视角重建的具有一致拓扑的面网格的网格体渲染方法，通过将稀疏网格特征扩散到周围空间以模拟体渲染所需的辐射场，从而实现对网格几何和隐式外观特征的梯度反向传播，并展示了变形不变性的特性以实现网格编辑后的逼真渲染。

Apr, 2024

3DVNet: 多视角深度预测和体积细化

3DVNet 是一种结合了先前基于深度和体积的 MVS 方法优点的新型多视图立体 (multi-view stereo) 深度预测方法，使用基于体积的三维卷积神经网络来对所有深度图进行操作，并能够学习有意义的场景级先验知识，其在深度预测和 3D 重建度量上均超越了现有技术，证明该方法在新的环境下具有很好的效果和通用性。

Dec, 2021

神经体积：从图像中学习动态可渲染的体积

通过学习，我们提出了一种表示动态物体的方法，该方法由编码器 - 解码器网络和可微分的射线行进操作组成，它不需要明确重建或跟踪物体，使用了 3D 体积表示法，表现出更好的图像质量，为高分辨率应用提供了一种从表面到体积的方法

Jun, 2019

基于 3D 感知正则化的多任务学习

通过引入结构化 3D-aware 正则化方法，将深度神经网络与多任务背景相结合，可以改善性能。

Oct, 2023

通过具有注意深度融合先验的体渲染学习神经内隐

通过体积渲染和专注深度融合先验进行多视角 RGBD 图像学习神经隐式表示，以准确进行 3D 重建。该方法利用截断有符号距离函数（TSDF）从所有可用的深度图像融合并感知粗糙三维结构，解决了通过体积渲染进行几何推断的不完整深度和被遮挡结构的问题。通过引入注意机制，直接将深度融合先验与学习到的占用情况作为神经隐式函数，该机制可以用于整个场景或同时定位和映射（SLAM）背景下的部分场景。在合成和真实世界的广泛基准测试中，该方法超越了最新的神经隐式方法。

Oct, 2023

VSRD：基于实例感知的体素轮廓渲染用于弱监督的 3D 物体检测

我们提出了一种新的弱监督三维物体检测框架 VSRD，利用自动标注阶段生成的伪标签在多视图三维自动标注和单目三维物体检测训练中优化三维边界框，实验表明我们的方法优于现有弱监督三维物体检测方法。

Mar, 2024

神经隐式表面的体绘制

该论文旨在提高神经体积渲染中几何表示和重建的质量，通过将体积密度定义为拉普拉斯累积分布函数作为有符号距离函数的表示，实现了形状和外观的有效无监督解缠，并在具有多视图的数据集中获得了高质量的几何重建结果。

Jun, 2021

从单张深度图实现语义场景补全的视点网络

本文介绍了一种名为 VVNet 的卷积神经网络，可从单个深度图像中推断出体积三维场景的占用率和语义标签，VVNet 有效地降低了计算成本，提高了结果的准确性。

Jun, 2018