Aug, 2022

使用必要条件分析识别辅助或对抗任务以进行对抗多任务视频理解

TL;DR本文提出了对多任务学习的一般化认识,通过同时引入模型应该擅长处理的辅助任务和模型不应该擅长处理的对抗任务,并采用基于数据的必要条件分析 (NCA) 方法来决定这些任务属于什么类型。我们提出的 AMT (Adversarial Multi-Task Neural Networks) 框架,通过惩罚 NCA 确定为全局视频理解 (HVU) 数据集中的场景识别,以提高动作识别的准确率。在保留多任务学习所有优势的同时,使用辅助任务——对象识别来帮助动作识别。我们引入了 HVU 的两个具有挑战性的场景不变的测试分裂,通过评估模型对于训练中未遇到的动作-场景共现的准确性进行实现,结果显示我们的方法的准确率提高了约 3%,同时鼓励模型关注动作特征而不是相关偏差场景特征。