May, 2024

层次行为识别:基于对比式视频 - 语言方法和层次交互

TL;DR通过构建新的细粒度数据集,提出了适用于层级识别的视频 - 语言学习框架,有效地解决了视频识别中的层级分类问题,对于细分子类尤其效果显著,为视频理解任务中的层级建模铺平了道路。