MMNov, 2021
AVA-AVD: 野外音视频说话人分离
AVA-AVD: Audio-Visual Speaker Diarization in the Wild
Eric Zhongcong Xu, Zeyang Song, Satoshi Tsutsui, Chao Feng, Mang Ye...
TL;DR本研究致力于提高在野外视频中识别 “谁何时说话” 的音视频扬声器分离的准确性,它创建了 AVA 音频 - 视觉扬声器分离(AVA-AVD)数据集和一种称为 AVR-Net 的新方法,通过加入 AVA-AVD 数据集的训练可以在相对较小的数据集上显着提高结果。