CVPRJun, 2024
ALGO:基于物体纳入的视觉常识推理用于开放世界自我中心动作识别
ALGO: Object-Grounded Visual Commonsense Reasoning for Open-World Egocentric Action Recognition
Sanjoy Kundu, Shubham Trehan, Sathyanarayanan N. Aakur
TL;DR在开放环境中学习推断标签,即在目标 “标签” 未知的情况下,是实现自主性的重要特征。我们提出了一种神经符号框架(ALGO),通过使用存储在大规模知识库中的符号知识,在仅有有限监督的情况下,推断自心视角视频中的活动。