CVPRJun, 2024

ALGO:基于物体纳入的视觉常识推理用于开放世界自我中心动作识别

TL;DR在开放环境中学习推断标签,即在目标 “标签” 未知的情况下,是实现自主性的重要特征。我们提出了一种神经符号框架(ALGO),通过使用存储在大规模知识库中的符号知识,在仅有有限监督的情况下,推断自心视角视频中的活动。