Nov, 2023

基于遮挡边界框重建的自监督学习视觉关系检测

TL;DR提出一种新颖的自监督方法用于表示学习,特别适用于视觉关系检测,通过对象级的屏蔽建模,网络学习到能够捕捉场景中对象之间相互作用的上下文感知表示方法,并在少样本情况下通过预测对象间视觉关系,实现了学习稳健视觉表示的效果优于当前最先进的视觉关系检测方法。