深度音视频学习综述

Jan, 2020

Deep Audio-Visual Learning: A Survey

Hao Zhu, Mandi Luo, Rui Wang, Aihua Zheng, Ran He

TL;DR本篇论文综述了近期音视频学习发展的四个子领域：音视频分离和定位，音视频对应学习，音视频生成以及音视频表示学习，重点讨论其最先进的方法，剩余的挑战以及常用的数据集和性能评估。

Abstract

audio-visual learning, aimed at exploiting the relationship between audio and visual modalities, has drawn considerable attention since deep learning started to be used successfully. Researchers tend to leverage