Nov, 2023

动作-插槽:交通场景中的多标签原子活动识别的视觉动作中心表示

TL;DR我们研究了多标签原子活动识别,引入了基于槽的关注方法来学习视觉的动作中心表示,并通过在TACO数据集上进行预训练来提高多标签原子活动识别在真实数据集中的性能。