- 同时进行地图和物体重建
本文提出了一种用于从 LiDAR 重建大规模城市场景的动态表面重建方法,通过全局优化降低预测表面与输入 LiDAR 扫描数据的距离,实现了对刚性移动物体的运动补偿,并展示了该系统在自动标记局部注释序列和生成难以标记问题的真实注释方面的应用。
- 城市建筑师:带有布局先验的可操控的三维城市场景生成
通过引入一种组合式 3D 布局表示方法到文本转 3D 范式中的本文,克服了在大规模城市范围内扩展这一方法的局限性,并且成功地将文本转 3D 技术应用于覆盖超过 1000m 行驶距离的大尺度城市场景,同时展示了可调控城市场景生成的强大能力。
- HO-Gaussian: 三维高斯插值用于城市场景的混合优化
通过将网格体积与 3D 高斯喷洒(3DGS)管道结合,提出了一种名为 HO-Gaussian 的混合优化方法,以克服使用初始结构运动(SfM)点的依赖性,从而使得在城市场景中进行渲染成为可能,并且引入了点密度化来提高在训练期间出现问题的区域 - HGS-Mapping: 基于混合高斯表示的城市场景在线稠密地图构建
提出了一种在无界大规模场景中的在线密集建图框架 HGS-Mapping,它引入了混合高斯表示方法,使用具有不同属性的高斯模型来对整个场景的不同部分建模,并采用混合高斯初始化机制和自适应更新方法实现高保真和快速重建,在线密集建图的同时实现了 - HUGS: 通过高斯分布点绘制进行城市环境全面三维场景理解
基于 RGB 图像的城市场景的整体理解是一个具有挑战性但重要的问题,本文提出了一种利用三维高斯点云分布的新型管道,通过联合优化几何、外观、语义和动作,实现对城市场景的整体理解,并在实验证明了我们方法的有效性。
- 语义占用地图中的城市场景扩散
利用 Bird's-Eye View 地图条件的 3D 扩散模型 UrbanDiffusion 生成具有几何和语义的城市场景,并通过训练实际驾驶数据集,该模型能够生成多样性的城市场景,进一步将生成的场景扩展到任意规模,并通过预训练的图像生成 - RoDUS: 城市场景中静态和动态元素的稳健分解
使用 RoDUS 分解算法和 NeRF 模型,在城市场景中准确地捕捉静态和动态元素以及减少背景重建中的错误。
- 城市场景超分辨率通过几何误差最小化
本文提出一种通过几何误差最小化的城市场景超分辨率方法,该方法利用 Hough 变换提取城市场景中的常规几何特征,有效恢复细节和几何规律,特别在城市场景方面表现优于现有的最先进方法。
- ICCVAPNet: 都市级别航拍图像和点云的场景分割
我们专注于城市场景点云的语义分割方法,提出了一种名为 APNet 的网络架构,利用不同上下文信息和网络架构的协同利用,将点云分支和航空影像分支进行几何感知融合,以达到数据融合的最佳性能。实验证明,融合模块的输出始终优于各个网络分支的结果,并 - ECCV视频场景理解的概率未来预测
本文提出了一种新颖的深度学习架构,用于从视频中进行概率未来预测。该模型可以预测城市场景中的未来语义、几何和运动,并将此表示用于控制自动驾驶车辆。
- 计算机视觉任务的自监督域自适应
本文提出了一种自我监督域自适应的通用方法,重点关注简单的预训练任务,如图像旋转预测,运用于对象识别和城市场景语义分割等场景,并提出了预测层对齐和批归一化校准等策略以进一步提高其准确性。实验结果表明自我监督在域自适应方面具有很大的潜力。
- 通过预测视图效用学习得分:高效的三维场景探索
该研究提出了一种基于卷积神经网络的学习型实用函数,用以预测和最大化探测未知场景中的有用信息,该方法在使用干扰噪声的情况下,比现有实用函数具有更高的重建性能,在城市场景的大型 3D 模型中得到了验证。
- 多尺度体素深度网络对点云场景的分类
描述了一种卷积神经网络,用于分类城市或室内场景的 3D 点云,采用多尺度邻域的点位置进行点分类,排名第二,并打败了不使用正则化步骤的最新点分类方法。