LOCI 循环：从视频中发展物体恒常性

Oct, 2023

LOCI 循环：从视频中发展物体恒常性

Looping LOCI: Developing Object Permanence from Videos

Manuel Traub, Frederic Becker, Sebastian Otte, Martin V. Butz

TL;DR通过引入具有内部处理循环的 Loci-Looped 算法，本研究旨在推进组合场景表示算法，促进基于婴儿发展类似的直觉物理学习，以实现在对象遮挡或临时感官数据中断时无需显式历史缓冲区即能跟踪物体，以及以完全无监督的涌现方式学习对象永恒性和惯性这两个物理概念。

Abstract

Recent compositional scene representation learning models have become remarkably good in segmenting and tracking distinct objects within visual scenes. Yet, many of these models require that objects are continuously, at least partially, visible. Moreover, they tend to fail on

compositional scene representation learning intuitive physics loci-looped object occlusions unsupervised emergent manner

发现论文，激发创造

学习是什么和在哪里：无监督分离位置和身份跟踪

介绍了一种被称为 Loci 的自监督位置和身份追踪系统，通过处理分离的 “何处” 和 “何物” 的槽状编码解决了绑定问题，可以从视频流中有效地提取对象并将其分离成位置和整体组件，从而在概念层面上促进了有效的规划和推理。

May, 2022

局部分割：改进场景分割学习

以基于插槽的处理方法为基础的场景表示的分解性处理方法已经取得了巨大的发展。我们介绍了 Loci-Segmented（Loci-s），这是一个先进的场景分割神经网络，扩展了基于插槽的位置和身份跟踪架构 Loci。

Oct, 2023

基于目标级空间布局和语义一致性的回环检测

本文提出了一种基于 3D 场景图的物体级别数据关联方法来实现 SLAM 系统中的闭环检测，其中使用语义信息、交叉联合、物体颜色和物体嵌入等方法来进行对象级别的数据关联，最终得到全局一致且更加精确的 3D 语义地图。

Apr, 2023

从视频中学习对象的永恒性

通过数据学习目标物体的位置推测，需要拆分成四个子任务，其中第四个子任务最具挑战性，因为它需要一个系统来推理不可见物体的移动位置，本文介绍了一个统一的深度架构，可以在四种情况下学习预测物体位置，并在基于 CATER 的新数据集上对其进行评估，发现它优于以前的定位方法和各种基线。

Mar, 2020

学习目标不变的物体跟踪

该论文提出了一种端到端可训练的方法，结合物体检测和跟踪，并引入了序列记忆模块，使其更好地处理多物体跟踪，尤其是遮挡的情况。经过大规模的合成数据和实际测试，在 KITTI 和 MOT17 数据集上取得了最先进的性能表现。

Mar, 2021

基于条件的视频目标中心学习

该论文提出了一种弱监督学习方法，以对象为中心的表示和光流条件模型，可提高现实数据下的实例分割和追踪效果，改进了查询模型的灵活性，并扩展了应用范围。

Nov, 2021

基于场景图的视角不变和准确的循环检测方法

介绍了一种基于逐步创建的场景图的新型回路检测方法，针对室内场景的视觉 SLAM。它同时考虑了宏观视图拓扑、微观视图拓扑和语义实例的占用率来找到正确的对应关系。

May, 2023

视而不见，仍在脑海中：基于视频追踪启用记忆模型的未被观察到的物体的推理与规划

通过将变形器关系动力学用于部分视图点云和物体发现和跟踪引擎，我们提出了 DOOM 和 LOOM，旨在将面向对象的记忆编码到多物体操纵推理和规划框架中，以实现机器人在真实环境中可靠地处理先前观察但当前被遮挡的物体的问题，并成功实现了包括处理遮挡物体、新物体出现和物体再出现在内的多个具有挑战性的任务。通过大量的仿真和真实世界实验，我们发现我们的方法在不同数量的物体和干扰动作数量方面表现良好，并且超过了隐式记忆基准。

Sep, 2023

动态未访问环境下的潜在布局定位 - LaLaLoc

LaLaLoc 利用房间布局的潜在表示进行本地化，通过潜在空间中的直接交叉模态姿态优化实现对全景图的细粒度姿态估计，从而在没有先前访问的情况下弥补了其它方法的缺陷，具有鲁棒性和较高的准确性。

Apr, 2021

LoCo：局部受限无训练布局到图像合成

本文中，我们提出了一种名为 LoCo 的无需训练的布局到图像合成方法，能够通过引入局部化注意约束和填充令牌约束，对个体对象进行精确定位并防止合成对象的不良融合，并成功地集成到现有的文本到图像和布局到图像模型中，在多个基准测试中定性和定量地超越了既有的最先进的无需训练的布局到图像方法，展示了我们方法的优越性。

Nov, 2023