CVPRApr, 2023

VLPD: 通过视觉语义自监督实现上下文感知的行人检测

TL;DR本论文提出了一种基于视觉语言自监督学习的上下文感知行人检测方法 (VLPD),采用自生成的显式语义类标签来学习语义分割和行人检测任务,并提出了自我监督原形语义对比学习方法来更好地判别行人和其他分类,并在流行的基准数据集上进行了广泛的实验,证明了我们提出的 VLPD 在小尺度和重度遮挡等挑战性情况下均具有优越的性能。