在本研究中,我们通过对基于槽的方法进行系统研究,以解决槽的数量选择对学习对象相关表示的影响问题,我们发现槽的数量选错会导致过度或不足分割的问题,并探讨了目标函数和注释实例级别等因素对改善问题的影响。
May, 2023
该论文提出了一种弱监督学习方法,以对象为中心的表示和光流条件模型,可提高现实数据下的实例分割和追踪效果,改进了查询模型的灵活性,并扩展了应用范围。
Nov, 2021
本文介绍了一种通过基于槽的神经网络、空间对称和基于槽的参考帧来提高目标探测的数据效率的方法,并通过多个合成和真实场景以及挑战性的数据集进行了评估和实验。
Feb, 2023
本文提出利用跨实例视觉一致性作为监督信息,通过建立一个包含 4 个环(4-cycle)的人工数据集提高深度学习在实现物体实例间的稠密视觉对应中的表现,并在测试阶段显示出优于先前相关任务的最新成果。
Apr, 2016
本文提出了一种在现实和合成数据集中具有显著改进的物体分割方法,称为对象中心视觉,它在现有模型中引入了空间局部性先验,并模拟了人类视觉注意力的功能。
该研究对现有的物体中心模型的概念限制进行了识别和分析,提出了一种基于复值激活和对比学习的改进同步模型。通过引入新的构架和方法,该同步模型可以在多物体彩色数据集中无监督地发现物体,并同时表示超过三个物体。
利用无监督技术从视觉数据中学习多对象动态是一项具有挑战性的任务。本文提出一种新的框架,通过机器人交互学习可以学到稳健的对象表示的两个新架构:SlotTransport 用于从 RGB 图像中发现对象表示,SlotGNN 用于从 RGB 图像和机器人交互中预测它们的集体动态。
Oct, 2023
学习模块化的物体中心表示对于系统化的泛化至关重要。现有的方法在经验上显示出有前景的物体绑定能力,但理论上的可识别性保证相对较少。理解何时可以在理论上识别物体中心表示对于按槽位进行高维图像的扩展方法具有重要意义且具有正确性保证。为此,我们提出了一种概率化的槽位注意力算法,通过在物体中心化槽位表示上施加聚合混合先验,从而在没有监督的情况下提供槽位可识别性保证,达到等价关系。我们通过简单的二维数据和高分辨率成像数据集进行了我们的理论可识别性结果的实证验证。
Jun, 2024
本文提出了一个名为 Slot Attention 的架构组件,它能够从低级感知特征中提取物体为中心的表示,并能够推广到未见组合。
Jun, 2020
利用因果表征学习和面向物体的学习相结合,通过修改 Slot Attention 架构,开发出了一种利用稀疏扰动进行弱监督的物体中心化架构,以更少的扰动成功解缠多个物体的属性。