Jun, 2023

基于 Utterance 级别音频对齐距离的无监督语音可理解性评估与 Wav2Vec-2.0 表示法的应用

TL;DR本研究提出一种基于无监督方法的自动语音可懂度检测技术,使用 Wav2Vec-2.0 的自监督表示,考虑使用使用动态时间规整算法(DTW)计算对齐距离来区分可懂语音和不可懂语音。通过验证,该方法的检测准确率分别为 90.37%、92.57%和 96.58%。