Jun, 2017

VoxCeleb:一个大规模的说话人识别数据集

TL;DR本文介绍了一种基于计算机视觉技术的全自动管道,用于从开源媒体中创建一个大规模的必须文本无关语音识别数据集,并在其上应用和比较不同的演讲者识别技术以建立性能基线。