关键词object-centric methods
搜索结果 - 2
- 掩码式多查询槽注意力用于无监督对象发现
通过利用 DINO ViT 特征的集合查询表示来重建输入特征,我们提出了一种基于物体为中心的方法,通过遮罩输入特征,有选择性地忽略背景区域,以便模型在重建阶段更关注显著对象。此外,我们将 slot attention 拓展为多查询方法,使模 - 神经槽解释器:在新出现的槽表示中为物体语义提供基础
通过利用类似 XML 的编程语言将场景的目标语义组织成面向对象的程序原语,神经插槽解释器 (Neural Slot Interpreter, NSI) 学习对目标语义进行细分和生成,通过共享嵌入空间上的双层对比学习目标原语,从而从地面关联模