BriefGPT.xyz
大模型
Ask
alpha
关键词
3d occupancy
搜索结果 - 5
ViewFormer:基于视图引导的 Transformer 模型探索多视角 3D 占位感知的时空建模
基于 3D 占据率、多视图特征聚合和动态场景的研究,我们提出了 ViewFormer,一个基于 Transformer 的视觉中心框架,具有高度的可扩展性和优越性能。
PDF
2 months ago
CVPR
视觉语言导航的体积环境表示
基于视觉观察和自然语言指令,本论文提出了一种基于体素化环境表示的视觉语言导航模型,在多任务学习的影响下,预测 3D 占用、3D 房间布局和 3D 边界框,并通过在线采集的环境表示进行体积状态估计和建立序列记忆,取得了在 VLN 基准测试(R
→
PDF
3 months ago
自主驾驶的三维占据世界模型学习
理解 3D 场景的演变对于自动驾驶决策至关重要。本文通过在 3D 占据空间中学习 OccWorld 世界模型,同时预测自车运动和周围场景的演变,提出了一种新的框架。实验证明了 OccWorld 在无需使用实例和地图监督的情况下具有有效建模驾
→
PDF
7 months ago
Occ²Net: 基于三维占空比估计的鲁棒图像匹配算法应用于遮挡区域
本文提出 Occ$^2$Net,一种新颖的图像匹配方法,利用 3D 占用来建模遮挡关系,并推断出遮挡区域中的匹配点。通过在 Occupancy Estimation (OE) 模块中编码归纳偏差,简化了多视图一致的 3D 表示的引导启动,以
→
PDF
a year ago
场景作为占用
通过提出一种新的 3D Occupancy 表示法 (OccNet),并在 nuScenes 数据集上建立了 OpenOcc,我们方法能够有效地为多个驾驶任务提供有力的支持,并取得了显著的性能收益,例如运动规划可以实现 15%-58%的碰撞
→
PDF
a year ago
Prev
Next