May, 2022

野外说话人识别

TL;DR本研究提出了一种用于在声音数据源中识别演讲者数量并确定属于每位演讲者的音频的流程,并引入了聚类纯度和聚类唯一性两个指标来评估其准确性。该方法可用于印欧语系语音识别的数据预处理。