Jun, 2021

基于相对规范对跨领域第一人称音视频动作识别进行对齐

TL;DR本文提出利用音视频信号的内在互补性来学习一种表示,该表示对于训练数据表现良好,并且能够在不同域之间进行泛化,以增强跨领域第一人称行动识别的能力,结果表明该方法在流行的 EPIC-Kitchens 数据集上具有很强的效果。