Aug, 2023

细致的耳语:利用自动语音识别的进展进行稳健和可解释的失语症亚型分类

TL;DR该研究提出了一种全自动的方法来识别语音记录中的语音异常,以帮助评估语音障碍。结合连续时间分类(CTC)和基于编码器 - 解码器的自动语音识别模型,生成丰富的声学和干净的转录本。然后,应用几种自然语言处理方法从这些转录本中提取特征,以产生健康语音的原型。利用这些原型的基本距离度量作为标准机器学习分类器的输入特征,可以实现与人类水平相当的准确性来区分患有失语症的人与健康对照组的记录。此外,可以以 90% 的准确性区分最常见的失语症类型。该流程可直接应用于其他疾病和语言,并显示出从语音诊断标志提取的强大前景。