Oct, 2023

视频中以人为中心的行为描述:新的基准和模型

TL;DR在视频监控领域中,描述每个个体的行为变得越来越重要,特别是在复杂场景中存在多个个体的情况下。为了解决此问题,我们构建了一个以人为中心的视频监控标题数据集,提供了 7,820 个个体的动态行为的详细描述,并且提出了一种新的视频标题方法,可以在个体级别上详细描述行为,并达到了最先进的结果。