Apr, 2022

非裔美国英语方言密度自动估算

TL;DR本文利用几种音频和语言分析特征,包括 X-vector 表示法,ComParE 特征以及从 ASR 转录文件中提取的信息等,探究了非标准方言比例的自动预测方法,使用弱监督模型将 X-vector 和韵律特征投影到低维度的任务相关特性中,用 XGBoost 方法预测说话人的方言密度且评估其在此任务中的效用。最后,作者在 CORAAL 数据库的音频片段上展示了其方法相对于地面真实数据的显著相关性,并将其作为一种解释和减少语音技术偏见的工具。