CVPRMay, 2022

Bongard-HOI: 用于人 - 物互动视觉推理的几支学习基准评测

TL;DR该研究提出了一种视觉推理基准测试,名为 Bongard-HOI,用于组合学习自然图像中的人 - 物交互。该基准测试模拟实际场景中的一些情况,通过 few-shot instance 和难例的设计,将正负图像仅在动作标签上发生分歧,使得仅仅识别物体类别就无法完成测试,对于当今的视觉识别模型来说是具有相当大的挑战。