- StereoDiffusion:基于潜在扩散模型的无训练立体图像生成
为满足多种 XR 设备的需求,我们介绍了一种名为 StereoDiffusion 的方法,该方法与传统的修复流程不同,无需训练即可轻松使用,并与原始的 Stable Diffusion 模型完美集成。我们的方法通过修改潜变量,能够快速生成立 - 野外的自动珊瑚礁鱼类识别与三维测量
本文介绍了一种使用立体图像的流水线,自动识别、跟踪鱼类并测量鱼群数量。
- 神经分布式图像压缩与交叉注意特征对齐
本文介绍了一种新的编解码方法,可以压缩成对立体图像并利用解码器端的相关性附加信息,以更有效地重构图像。该算法利用了交叉注意力模块对齐处理相关特征图,实验验证了其在 KITTI 和 Cityscape 数据集上的优越性能。
- 基于公共信息的神经分布式图像压缩
提出了一种新颖的深度神经网络结构,用于在仅在解码器处存在相关图像侧信息时压缩图像,特别地,我们考虑一对立体图像并假设其中一幅图像要被压缩和传输,而另一幅图像仅在解码器处可用,我们的方法利用解码器只有的侧信息进行压缩并得到了比之前工作更好的结 - 基于语义先验的并行立体去雨网络:超越单目去雨
本文提出了一种 Paired Rain Removal 网络(PRRNet),它在去除降雨图像上利用了语义信息和立体影像,并展示了其在单 ocular 和构建的立体降雨数据集上优于其他算法的性能。
- 基于 4D 特征一致性嵌入空间的自动驾驶实时立体三维检测
本文提出了一种名为 RTS3D 的方法,使用立体图像实现高效、准确的 3D 目标检测,通过设计一个新颖的 4D 一致性嵌入空间将物体的结构和语义信息编码,并通过降低 FCE 空间噪声的影响,实现与先进方法相比高 10% 的平均精度。
- CVPR深度立体视觉的持续适应
提出一种 Modularly ADaptive Network (MADNet) 架构和 Modular ADaptation (MAD, MAD ++) 算法设计,实现在不同环境下对深度估计进行实时自适应的端到端架构,无需与输入图像不同的 - SAMP:用于四维车辆重建的形状和运动先验
使用三维形状和运动先验来规范车辆的轨迹和形状,并通过在序列立体图像中施加共同的形状和运动模型,从而实现对车辆的姿态和形状的推断,得到了在 KITTI 数据集上的最新成果。
- CVPRDisp R-CNN: 通过形状先验引导实例视差估计的立体三维物体检测
Disp R-CNN 是一种用于从立体图像中检测 3D 物体的新型系统,采用实例视差估计网络(iDispNet)实现对感兴趣区域像素的视差预测,以及利用统计形状模型生成密集视差伪地面真值,使其在缺乏 LiDAR 地面真值的情况下,具有出色的 - 实时语义立体匹配
研究表明,语义立体匹配比独立任务能更好地了解机器人、自我导航、增强现实等领域的场景理解。本文提出了一种单一的紧凑型和轻量级架构,通过多阶段的自上而下的估算,使得在任何硬件上和任何应用中都可以获得非常快速的推理,并对特定的应用要求进行准确度和 - 基于 FPGA-CPU 混合系统芯片实现功耗较低的实时高精度密集深度
本文提出一种结合 SGM 和 ELAS 方法的 FPGA-CPU 芯片的立体图像算法,实现了高效和高精度的深度数据点云的计算,并在 KITTI 2015 数据集上以 50FPS 的速度和 5W 的功率消耗下,达到了仅 8.7%的误差率。
- ICLRPseudo-LiDAR++: 自动驾驶中三维物体探测的准确深度
本文提出一种基于伪激光雷达(pseudo-LiDAR)的物体三维检测方法,通过改进其立体深度估计的网络结构和损失函数,以及通过利用稀疏的廉价激光雷达传感器的测量结果来传播深度估计值,从而实现对目标的准确检测。在 KITTI 数据集上的实验表 - CVPR三角化学习网络:从单目到立体 3D 物体检测
本文研究从立体图像中检测 3D 物体的问题,提出了使用 3D 锚点构建物体级对应的方法来增强检测和定位的深度神经网络,使用经济高效的渠道重新加权策略来增强表示特征。在 KITTI 数据集上,这些方法都优于现有方法。
- ICCVFlickr1024:用于立体图像超分辨率的大规模数据集
该研究提出了一个名为 Flickr1024 的大规模立体数据集,由于最近发布的智能手机中双摄像头的普及,越来越多的超分辨率方法被提出来用于增强立体图像对的分辨率,但是高质量三维立体数据集的缺乏限制了该领域的研究。实验表明,与 KITTI 和 - 深度立体回归几何和上下文的端到端学习
该文提出了一种基于深度学习的新型架构,用于处理立体图像的视差回归问题,通过代价体积和不同 iable sof argmin 算法来进行图像处理,并在 KITTI 数据集上创造了新的最佳性能结果。
- 使用多尺度深度网络从单张图片预测深度图
本文提出了一种新的方法,利用两个深度网络堆栈来解决单张图像深度估计的问题,并应用尺度不变误差来测量深度关系,通过利用原始数据集作为大量训练数据,方法在 NYU Depth 和 KITTI 上实现了最先进的结果。