- ECCVBeNeRF:从单个模糊图像和事件流生成神经辐射场
本研究提出了一种方法,通过从单个模糊图像和对应的事件流中恢复神经辐射场来模拟相机运动,并通过最小化合成数据和真实测量值之间的差异来联合学习隐式神经场景表示和恢复相机运动。
- 学习动作先验的视频生成
在考虑了相机运动或动作作为观察图像状态的一部分,并将图像和动作建模在多模态学习框架内的基础上,我们提出了三个模型:VG-LeAP 使用变分推断学习图像 - 动作潜在先验并将图像 - 动作对作为单一潜在随机过程生成的扩展状态;Causal-L - CVPR不同 iable 宽基线姿态优化的多会话 SLAM
我们介绍了一种新的多会话 SLAM 系统,可以在一个全局参考下跟踪多个不同的视频中的相机运动。我们的方法通过预测光流,并结合求解器层来估计相机姿态。该系统可以连接不连续的序列,进行视觉测距和全局优化,与现有方法相比,我们的设计精确且对灾难性 - DeblurGS:相机运动模糊的高斯喷洒
通过使用 3D 高斯喷洒来优化运动模糊图像中的清晰 3D 场景,我们的方法 DeblurGS 克服了初始相机姿态获取中的不准确性并实现了最先进的去模糊和新视角合成性能。
- DepthMOT:深度线索引导强大的多目标追踪器
通过实现深度感知和相机姿态估计,本文提出了 DepthMOT 算法,可以准确区分多个对象,并解决了拥挤场景中物体混淆和相机运动不规则导致的 ID 切换问题。在 VisDrone-MOT 和 UAVDT 数据集上的广泛实验表明 DepthMO - 基于自身移动感知的鲁棒多目标跟踪模块
本文提出了一种新的 KF-based 预测模块,通过整合相机运动、深度信息和目标运动模型,解耦相机运动对目标轨迹的影响,最大程度地提高目标运动模型的可靠性,从而显著降低 OC-SORT 和 Deep OC-SORT 的身份切换数量,提高性能 - CVPR利用事件和帧减轻神经辐射场中的运动模糊
本文提出了一种利用模型和学习模块的新方法,通过显式建模模糊形成过程和使用端到端可学习的响应函数来适应实际事件相机传感器中的非理想性,解决了运动模糊对 Neural Radiance Fields (NeRFs) 渲染图片质量的影响问题,结果 - 高斯喷洒移动:针对自然相机运动的模糊和快门滚动补偿
基于高斯子图的高质量场景重建和新视图合成通常需要稳定、高质量的照片,这往往难以通过手持相机捕捉。本文提出了一种适应相机运动、能够利用受运动模糊和滚动快门衍生的手持视频数据实现高质量场景重建的方法。我们的方法基于对物理图像形成过程的详细建模, - 相机运动估计的一致且渐进统计有效解决方案
研究了基于点对应关系推断图像对之间摄像机运动的问题,提出了一个基于最大似然问题的量测模型和两步算法,证明了该算法具有渐近统计性质,并在稠密点对应情况下具有显著优势。
- BCLNet:双边共识学习用于双视图对应关系修剪
通过并行上下文学习策略,我们提出了 Bilateral Consensus Learning Network (BCLNet) 来有效估计相机姿态并识别内点(真实对应关系),实验证明我们的网络在基准数据集上不仅超过了最先进的方法,而且展示了 - 图像高密度瞬时对齐通过相机位姿和深度估计
本文介绍了一种新颖的方法来对手持相机拍摄的图像进行细微对齐。与传统的技术不同,该算法通过优化每个像素的摄像机运动、表面深度和方向来建立密集对应关系。这种方法改善了在具有视差挑战的情况下的对齐效果。通过对具有小型或短小基线的合成连拍进行广泛实 - MotionCtrl:统一灵活的视频生成运动控制器
该论文介绍了 MotionCtrl,这是一个用于视频生成的统一和灵活的运动控制器,通过有效和独立地控制相机运动和物体运动,实现更精细的运动控制和促进两种类型运动的灵活多样组合。
- 基于不变性的观察者普通运动下空间映射
该论文研究了基于视觉动态的不变性,通过利用非线性函数与光流之间的关系,提出了一种新的瞬时领域,使得静止环境在连续的相机运动中保持不变,能够在特定的子空间中检测和避开障碍物,并可能检测移动物体。
- 利用新型基于光流的无关距离不变性检测移动物体
该论文研究了在摄像机运动过程中检测移动物体的一种新方法,提出了一种基于光流的变换,可以生成一个不变的二维图像输出,无论时间瞬间、3D 点的范围以及摄像机的速度如何变化。这种方法通过在新域中将 3D 点的投影与预定义的查找图像的值进行比较,能 - MMMake-It-4D: 从单张图像综合生成一致的长期动态场景视频
通过估计 4D(包括 3D 几何和场景运动)并填充遮挡区域,本文提出了 Make-It-4D 方法,从单个图像中生成一致的长期动态视频。通过使用分层深度图像(LDIs)表示场景,并利用运动估计和相应的相机姿势引导的场景流来位移特征点云,我们 - 醉汉的测程法:估算变形场景中的摄像机运动
本研究提出了一个具有挑战性的数据集 Drunkard's Dataset,为解决在变形场景下探索摄像机轨迹和重构,设计了一个新的变形 odometry 方法(Drunkard's Odometry),该方法将光流估计分解为刚体摄像机运动和非 - 神经隐式稠密语义 SLAM
提出了一种利用神经隐式场表示解决室内场景语义 V-SLAM 问题的在线框架,并通过多项实验表明其在测试时间具有精确的跟踪、地图绘制和语义标注能力,能够扩展到 RGB 图像输入,为机器人视觉感知及相关问题提供了可行的解决方案。
- 神经形态学地球观测密度不变对比度最大化
本文提出的事件在计算对比度之前校正,从而克服了具有多个极值问题和噪声容忍度问题的对比度最大化技术应用于事件感知的挑战,并使用来自国际空间站的新数据集,通过分析的补偿技术实现更好的运动补偿映射。
- CVPR从野外视频中分离人类与摄像机运动
本研究提出了一种从野外视频中重建全球人类轨迹的方法,该优化方法将相机和人类运动解耦,减少背景像素对推断 3D 人类运动的影响,使用数据驱动的先验信息来恢复全局人类轨迹。
- CVPR基于对数 - 对数稠密光流残差的视觉里程计
本文提出了一种基于外部估计的光流场而不是手工特征对应的密集间接视觉里程计方法,将其定义为概率模型,并开发了一种广义 EM 公式用于联合推断相机运动、像素深度和运动跟踪置信度。通过自适应的对数 - 对数逻辑分布模型对我们的推理框架进行监督,充