Sep, 2022

使用 WavLM 预训练特征进行重叠语音和性别检测

TL;DR本文介绍了使用 WavLM 模型识别重叠语音和性别检测,以研究法国视听媒体中男女交互的表现差异,并使用 DIHARD III 和 ALLIES 语料库进行实验,得到了新的性能状态和高精度的实验结果。