Sep, 2024

儿童-成年人互动中最先进的自动语音识别模型评估

TL;DR本研究针对临床环境中儿童与成年人对话的可靠转录能力进行评估,填补了现有研究的空白。我们采用最新的语音基础模型对自闭症诊断会话中的儿童-成年人交流数据集进行全面评估,发现相较于成年人语音,儿童语音的转录性能明显下降。通过对表现最佳的模型进行微调,儿童语音的转录错误率改善了约8%。