MMNov, 2021

AVA-AVD: 野外音视频说话人分离

TL;DR本研究致力于提高在野外视频中识别 “谁何时说话” 的音视频扬声器分离的准确性,它创建了 AVA 音频 - 视觉扬声器分离(AVA-AVD)数据集和一种称为 AVR-Net 的新方法,通过加入 AVA-AVD 数据集的训练可以在相对较小的数据集上显着提高结果。