Jul, 2024

离散群聚表示引导物体为中心的学习

TL;DR类似于人类将视觉场景视为对象,基于目标的学习(OCL)可以将密集图像或视频抽象成稀疏的对象级特征。我们提出了 “Grouped Discrete Representation”(GDR)方法,通过将特征分组为属性并使用元组编号对其进行索引,解决了将特征视为最小单位而忽视特征组成的属性的问题,并且在不同的查询初始化、数据集形式和模型架构的广泛实验中一致提高了收敛性和泛化能力。可视化结果显示我们的方法有效捕捉了特征中的属性级别信息。