CVPRJun, 2019

识别自我为中心物体交互,音频有多重要?

TL;DR本研究提出了一种音频模型,用于主体中心的动作识别,通过轻量化的架构,在视觉基础的标准数据集上取得了有竞争力的动词分类结果(34.26% 准确率)