CVPRJun, 2021

时空动作定位的关系建模

TL;DR本文提出一种用于动作识别的多类型关系建模方法,并采用训练策略将多种关系建模集成到两个大规模视频数据集的端对端训练中去。同时,结合记忆库的学习和面向长尾数据分布的微调方法,以进一步提高性能,最终在 AVA-Kinetics 测试集中实现了 40.67 mAP 的成绩。