可重复使用的分时机制

Feb, 2023

Reusable Slotwise Mechanisms

Trang Nguyen, Amin Mansouri, Kanika Madan, Khuong Nguyen, Kartik Ahuja...

TL;DR本研究提出了 RSM，一种采用可重复组件、学习场景的 “槽位式” 表示和动态选择机制的模块化架构，其可以很好地处理场景中不同对象之间的相互作用，可以应用于多种下一步预测任务中，并且在 Atari 2600 游戏中表现出色。

Abstract

Agents that can understand and reason over the dynamics of objects can have a better capability to act robustly and generalize to novel scenarios. Such an ability, however, requires a suitable representation of the scene as well as an understanding of the mechanisms that govern the interactions of different subsets of objects. To address this problem, we pro

rsm slotwise representation modular architecture central contextual information next-step prediction

发现论文，激发创造

槽位状态空间模型

我们介绍了一种新颖的框架 SlotSSMs，用于在状态空间模型中引入独立机制以保持或促进信息的分离，评估表明我们的设计在多对象建模和长期时间依赖性的任务中显著提高了性能。

Jun, 2024

槽位结构化世界模型

感知和推理个体物体及其相互作用是构建智能人工系统的目标，而 Slot Structured World Models 是一种结合基于 Slot Attention 的物体中心化编码器和潜在图形动力学模型的世界模型，用于解决当前方法在提取物体表示和区分相似物体方面存在的问题。

Jan, 2024

SlotGNN：无监督发现多物体表示和视觉动态

利用无监督技术从视觉数据中学习多对象动态是一项具有挑战性的任务。本文提出一种新的框架，通过机器人交互学习可以学到稳健的对象表示的两个新架构：SlotTransport 用于从 RGB 图像中发现对象表示，SlotGNN 用于从 RGB 图像和机器人交互中预测它们的集体动态。

Oct, 2023

随机多目标系统的关系状态空间模型

本文提出了一种基于关系状态空间模型 (R-SSM) 的序列分层潜变量模型，其利用图神经网络 (GNNs) 模拟多个相关对象的联合状态转移，同时提供了一种灵活的将关系信息纳入到多对象动态建模的方式，并且通过实验在合成和真实时间序列数据集上进行了验证。

Jan, 2020

RSRM: 强化符号回归机

提出了一种新的增强符号回归机 (RSRM) 模型，通过 Monte Carlo 树搜索、双 Q-learning 块和调制子树发现块，可以从极少的数据中学习复杂的数学方程，并取得了关于符号回归的最新性能记录。

May, 2023

视频的推理增强的物体中心学习

通过设计一种名为 STATM 的新型推理模块，可以显著增强基于插槽的视频模型的物体中心学习能力。

Mar, 2024

梦想着众多世界：学习上下文世界模型助于零样本泛化

提出了一种称为 cRSSM 的上下文循环状态空间模型，该模型通过将上下文与观察值结合起来，改进了 Dreamer 的世界模型，从而提高了在未见上下文情况下训练的策略的零 - shot 泛化能力。

Mar, 2024

不变槽注意力机制：基于槽中心参考系的物体发现

本文介绍了一种通过基于槽的神经网络、空间对称和基于槽的参考帧来提高目标探测的数据效率的方法，并通过多个合成和真实场景以及挑战性的数据集进行了评估和实验。

Feb, 2023

通过基于聚类的插槽初始化提升可解释的对象抽象

我们的工作使用聚类算法对感知输入特征进行初始化，设计了置换不变和置换等变版本的插槽初始化层，并利用均值漂移聚类自动确定给定场景的插槽数量。在各种数据集上进行对象发现和新视角合成任务的评估结果显示，我们的方法在复杂场景下始终表现优于先前的工作。

Aug, 2023

基于概率槽注意力的可识别物体中心表示学习

学习模块化的物体中心表示对于系统化的泛化至关重要。现有的方法在经验上显示出有前景的物体绑定能力，但理论上的可识别性保证相对较少。理解何时可以在理论上识别物体中心表示对于按槽位进行高维图像的扩展方法具有重要意义且具有正确性保证。为此，我们提出了一种概率化的槽位注意力算法，通过在物体中心化槽位表示上施加聚合混合先验，从而在没有监督的情况下提供槽位可识别性保证，达到等价关系。我们通过简单的二维数据和高分辨率成像数据集进行了我们的理论可识别性结果的实证验证。

Jun, 2024