- 多目标跟踪中的卷积无味扩展卡尔曼滤波器
多目标追踪是自主驾驶中的关键技术之一。本文提出了一种用于处理复杂交通场景中的异常值、提高追踪准确性的算法,称之为卷积 UKF。该算法在 KITTI 和 nuScenes 数据集上的实验结果表明,相对于基准算法,卷积 UKF 能够实现更高的追 - LoReTrack: 高效准确的低分辨率 Transformer 跟踪
通过从冻结的高分辨率 Transformer 追踪器中进行双重知识蒸馏,采用低分辨率输入来增强低分辨率 Transformer 追踪的性能,从而实现高效率和精度的 LoReTrack 追踪器。
- CVPR通过迭代稠密 UV 至图像流实现的二维视频三维人脸追踪
通过引入创新的 2D 对齐网络以进行稠密的顶点对齐,我们提出了一种新颖的人脸追踪器 FlowFace,用于改善三维面部数据的精确性和避免反感谷效应。与先前的工作不同,FlowFace 是基于高质量的三维扫描注释进行训练,而不是基于弱监督或合 - 单眼腹腔镜视频剪辑中解剖和手术器械的三维跟踪的神经场
该研究提出了使用神经场方法进行腹腔镜视频追踪的技术,可以同时追踪手术工具和解剖结构,具有较高的追踪精度,并能生成与预训练深度估计器相媲美的伪深度图像,从而展示了使用神经场进行单目腹腔镜场景的 3D 重建的可行性。
- 通过量子退火提高多目标跟踪的准确性
这篇研究论文介绍了一种利用量子退火来加快计算速度、通过集成物体跟踪过程提高跟踪准确性的新方法,并提出了一种改进匹配集成过程的方法。利用 MOT 的序列性质,通过逆向退火进一步增强了跟踪方法。实验证实,每个跟踪过程仅需要 3 微秒的退火时间即 - MoD2T: 模型数据驱动的运动 - 静态物体跟踪方法
MoD2T 是一种结合了传统数学建模和深度学习的多对象跟踪方法,提高了物体运动确 定性和跟踪精确度;通过 MVFI 度量标准评估效果,在多种场景下都取得了显著的成绩。
- UncLe-SLAM:面向稠密神经 SLAM 的不确定性学习
本文提出了一种基于不确定性学习的密集神经同步定位与地图构建方法,并通过传感器不确定性估计在线框架对其进行了优化。相较于现有的神经模型,该方法在多传感器输入情况下可实现更优秀的地图构建和定位精度。
- 学习会导致控制能力下降吗?分析高斯过程事件触发在线学习的计算延迟
本文提出了一种基于 Gaussian process regression 的在线学习的 event-triggered 策略,针对计算延迟设计了新的事件触发器,能够在保持追踪精度的前提下优化计算效率。
- CVPR使用多个摄像头跟踪大型养猪围栏内的生长 - 完成猪
使用多相机实现了跨摄像头追踪猪的位置,采用深度学习进行目标检测,并开放了相关的数据集和代码。
- CVPR无监督深度表示学习用于实时跟踪
提出了一种无监督学习方法,基于 Siamese 相关滤波网络,在前向追踪和反向追溯之间进行一致性测量来训练视觉跟踪器,并提出了多帧验证方案和一种成本敏感的损失来促进无监督学习,该方法在速度上达到实时水平,在不使用昂贵标记数据的情况下,实现与 - 基于实例感知跟踪器和动态模型更新的在线多目标跟踪
提出一种实例感知跟踪器,结合单个物体跟踪和卷积神经网络技术,用于多物体跟踪,提高跟踪准确性。在 MOT15 和 MOT16 基准测试上表现最佳。
- 揭开深度跟踪的力量
探究深度特征在目标跟踪中的局限性及其与手工特征关系,提出融合深度与浅层特征的自适应方法以提高跟踪的鲁棒性和准确性,并在四个数据集上进行实验证明该方法相较于当前最优跟踪算法有 17% 的提升。
- 长期视觉目标跟踪基准
提出了一种名为 Track Long and Prosper(TLP)的新型长视频数据集和单个目标跟踪基准,包含 50 个高清视频,超过 400 分钟(676K 帧),是现有通用数据集平均持续时间的 20 倍以上,通过对 17 种现有跟踪器 - 直接稀疏里程计
提出了一种新的直接稀疏视觉里程计公式,将全直接概率模型(最小化光度误差)与所有模型参数(包括几何结构 - 在参考帧中表示为反深度 - 和相机运动)的一致联合优化相结合。
- 单目视觉里程计光度校准基准
提出了一个包含 50 个具有独特多样性的现实中场景的数据集,用于评估单目视觉里程计和 SLAM 方法的跟踪精度,并在此基础上提出了一个相机光度校准的简单方法以及一种非参数化暗角校准方法,该研究详细评估了两种现有方法(ORB-SLAM 和 D - 基于 RGB 输入的实时面部分割和表现捕捉
通过显式的语义分割技术,利用深度学习网络在实时的不受限制的图像中进行面部追踪,进而应用于虚拟化妆和面部替换任务。