Mar, 2022

基于最优输运的可解释性发音障碍者语音适应

TL;DR本文提出一种基于最优传输的无监督多源域自适应算法 ——MSDA-WJDOT,用于解决难以识别的发音障碍语音命令识别中通过对多个说话人的数据进行训练以进行说话人自适应的特定问题。该方法相对于其他现有的 SA 方法具有可解释性模型,可用于诊断发音障碍,不需要任何专门的培训,并在发音障碍的诊断中取得 95% 的准确率。