Jun, 2022

使用 Transformers 和源 - 滤波变形的转移学习用于强健的低资源儿童语音自动识别

TL;DR本文提出数据增广技术和转移学习策略,使得基于 XLS-R 架构的 Transformer 模型能更好地识别儿童英语语音,测试集词错误率为 4.86%。