LOCI 循环:从视频中发展物体恒常性
介绍了一种被称为 Loci 的自监督位置和身份追踪系统,通过处理分离的 “何处” 和 “何物” 的槽状编码解决了绑定问题,可以从视频流中有效地提取对象并将其分离成位置和整体组件,从而在概念层面上促进了有效的规划和推理。
May, 2022
以基于插槽的处理方法为基础的场景表示的分解性处理方法已经取得了巨大的发展。我们介绍了 Loci-Segmented(Loci-s),这是一个先进的场景分割神经网络,扩展了基于插槽的位置和身份跟踪架构 Loci。
Oct, 2023
本文提出了一种基于 3D 场景图的物体级别数据关联方法来实现 SLAM 系统中的闭环检测,其中使用语义信息、交叉联合、物体颜色和物体嵌入等方法来进行对象级别的数据关联,最终得到全局一致且更加精确的 3D 语义地图。
Apr, 2023
通过数据学习目标物体的位置推测,需要拆分成四个子任务,其中第四个子任务最具挑战性,因为它需要一个系统来推理不可见物体的移动位置,本文介绍了一个统一的深度架构,可以在四种情况下学习预测物体位置,并在基于 CATER 的新数据集上对其进行评估,发现它优于以前的定位方法和各种基线。
Mar, 2020
该论文提出了一种端到端可训练的方法,结合物体检测和跟踪,并引入了序列记忆模块,使其更好地处理多物体跟踪,尤其是遮挡的情况。经过大规模的合成数据和实际测试,在 KITTI 和 MOT17 数据集上取得了最先进的性能表现。
Mar, 2021
介绍了一种基于逐步创建的场景图的新型回路检测方法,针对室内场景的视觉 SLAM。它同时考虑了宏观视图拓扑、微观视图拓扑和语义实例的占用率来找到正确的对应关系。
May, 2023
通过将变形器关系动力学用于部分视图点云和物体发现和跟踪引擎,我们提出了 DOOM 和 LOOM,旨在将面向对象的记忆编码到多物体操纵推理和规划框架中,以实现机器人在真实环境中可靠地处理先前观察但当前被遮挡的物体的问题,并成功实现了包括处理遮挡物体、新物体出现和物体再出现在内的多个具有挑战性的任务。通过大量的仿真和真实世界实验,我们发现我们的方法在不同数量的物体和干扰动作数量方面表现良好,并且超过了隐式记忆基准。
Sep, 2023
LaLaLoc 利用房间布局的潜在表示进行本地化,通过潜在空间中的直接交叉模态姿态优化实现对全景图的细粒度姿态估计,从而在没有先前访问的情况下弥补了其它方法的缺陷,具有鲁棒性和较高的准确性。
Apr, 2021
本文中,我们提出了一种名为 LoCo 的无需训练的布局到图像合成方法,能够通过引入局部化注意约束和填充令牌约束,对个体对象进行精确定位并防止合成对象的不良融合,并成功地集成到现有的文本到图像和布局到图像模型中,在多个基准测试中定性和定量地超越了既有的最先进的无需训练的布局到图像方法,展示了我们方法的优越性。
Nov, 2023