- 地球影像中的车辆向量和交通模式
探索在 Planet 影像中检测汽车的方法,并建立大规模的移动物体向量场。在高分辨率 SkySat 卫星和中分辨率 SuperDove 卫星上,静态和移动的汽车均可以可靠地识别。通过利用移动物体的带间位移(或 “彩虹” 效应),我们能够估计 - 地球观测卫星图像中的移动物体检测
通过对 Planet Labs Corporation 的 SuperDove 卫星星座所采集的卫星图像进行分析,我们评估了在这一卫星图像存档中检测移动物体并测量其速度的可行性,并提出了如何间接恢复时间信息的方法。我们的结果表明,可以检测和 - 利用机器学习检测移动物体
太阳系小天体的科学研究最终从对这些天体的搜索开始。本章对使用机器学习技术在天文图像中寻找移动天体(包括自然和人造天体)的方法进行了综述。综述包括了传统非机器学习技术的简要回顾以及相对不成熟的机器学习文献中的三大类方法:流迹检测、图像序列中移 - CVPR使用 4D 隐式神经表示在动态环境中进行的 3D LiDAR 地图构建
基于 LiDAR 扫描序列,我们提出了一种构建动态环境准确地图的新方法,利用四维场景进行稀疏特征格、全局共享解码器和时变基函数的神经表示,用于滤除动态部分并重建准确完整的三维地图。
- CVPR融合深度学习与几何运动模型的野外零样本单眼运动分割
通过使用深度学习和几何模型融合方法,在无需训练数据的情况下,我们提出了一种能够在移动单目摄像机中以零样本方式实现优秀的运动分割结果的新型单目密集分割方法,并通过实验证明了几何模型融合对于运动分割的有效性。
- 适应物体运动模糊的检索方法
我们提出了一种在受到运动模糊影响的图像中进行物体检索的方法,并通过学习鲁棒的表达方式,能够匹配模糊物体与其去模糊版本,我们还提供了首个大规模模糊物体检索数据集,并在多个实验中验证了我们的方法优于现有方法。
- FlowDepth: 光流与自监督单目深度估计的解耦
通过动态的运动流模块及深度感知模糊和成本体积稀疏损失,在自我监督多帧方法中解决了深度估计中的运动物体、光流和光度误差问题,并在实验中表现出超越其他方法的性能。
- CVPREntity-NeRF: 检测和移除城市场景中的移动实体
实体 - 神经辐射场(Entity-NeRF)是一种结合了基于知识和统计策略的创新方法,通过利用实体分割和静态实体分类来消除移动物体并准确重建静态城市背景。在移动对象遮罩的城市场景数据集上进行的综合实验表明,Entity-NeRF 在定量和 - DynamicGlue:使用图神经网络进行时空感知数据关联的动态环境解决方案
我们提出了一种基于图神经网络的稀疏特征匹配网络,旨在在具有挑战性条件下执行健壮的匹配,并在移动物体上排除关键点,实验结果表明,与最先进的特征匹配网络相比,我们的网络在在静态环境中实现了类似的结果,并且在高度动态的场景中显著提高了 SLAM - 自地面到物体:基于粗到细的自监督方法用于动态物体的单目深度估计与接触先验
基于粗到细的训练策略,通过引入接触地面先验的监督和规范化损失,以及利用代价卷积的加权因子,在自主单目深度估计中提高对移动物体的准确性和性能。
- Dynamo-Depth:修复动态场景的无监督深度估计
Dynamo-Depth 是一种基于未标记单目视频筛选的三维独立光流场和运动分割的联合学习的方法,通过解决动态场景下深度估计的不确定性问题,实现了在 Waymo Open 和 nuScenes 数据集上单目深度估计的最新成果,特别在移动物体 - 利用新型基于光流的无关距离不变性检测移动物体
该论文研究了在摄像机运动过程中检测移动物体的一种新方法,提出了一种基于光流的变换,可以生成一个不变的二维图像输出,无论时间瞬间、3D 点的范围以及摄像机的速度如何变化。这种方法通过在新域中将 3D 点的投影与预定义的查找图像的值进行比较,能 - 基于时间的视觉运动不变性的空间映射
本文研究基于视觉运动的不变性,从而获得三维点的表示,其中静态环境保持不变,确保形状恒定。通过利用可测量的光流的非线性函数,创造了一种新颖的表示方法,并称之为 “时间间隔” 和 “接触时间”。通过演示摄像机相对于三维物体的移动模拟和图像的变化 - 街景动画
我们提出了一个系统,通过在现有的街景图像上插入自然行为的动画行人和车辆,使其活灵活现。我们的方法是将输入图像中的现有人和车辆移除,插入具有适当比例、角度、运动和外观的移动对象,规划路径和交通行为,并以合理的遮挡和阴影效果渲染场景。该系统通过 - 稀疏雷达点云中可靠的动态实例分割:雷达实例转换器
通过使用雷达传感器在点云中进行运动实例分割,我们提出了一种可以增强场景解释的方法,在安全关键任务中取得了优秀的性能表现。
- 移动单目相机的运动分割
本研究讨论了利用点轨迹和光流等方法相互融合,在移动的单目摄像头中识别和分割运动物体,实现对复杂场景中不同对象运动的模拟,最终取得了最先进的效果。
- IJCAI通过上下文感知的时间关注学习动态环境下的单目深度
CTA-Depth 是一种用于多帧单目深度估计的网络,其采用多层关注增强模块与上下文感知时间关注 (CTA) 调整深度和姿态优化过程,以捕捉全局时间上下文关联并保持运动物体特征的一致性和估计完整性。特别地,该方法采用 LGE 模块来产生长程 - CVPRRM-Depth:动态场景下基于循环结构的单目深度非监督学习
该论文提出了一种无监督学习框架,通过使用逐步的递归调整和融合编码器和解码器特征来提高单张图像的深度推断,并使用多组滤波器用于残差上采样来学习保持边缘的滤波,使用基于自运动恢复的网络来估计移动对象的移动场,并进一步通过采用鲁棒训练损失对模型中 - BEVStereo:动态时间立体下的多视角三维物体检测深度估计增强
本文提出了一种基于时间立体的有效方法来处理三维物体检测中深度感知所固有的模糊性。其有效地选择了匹配候选项的比例,极大地减少了计算开销,设计了一种迭代算法来更新更有价值的候选项,使其适应于移动的候选项,并达到了比现有的 MVS 方法更好的性能 - 通过基于物体的分层表示进行移动物体分割
本篇论文介绍了一个基于对象中心的分割模型,借助变压器架构对光流进行处理来实现视频中的多个运动对象发现、追踪与分割。同时,采用可伸缩管线生成多对象合成训练数据,以及深度学习模型的全面验证研究,并证明其在表现、预测能力等方面都具备领先水平。