Oct, 2023

儿童阅读的端到端实时跟踪与指针网络

TL;DR本研究介绍了一种使用实时阅读跟踪器在儿童语音上进行高效构建的方法,通过采用端到端模型和指针网络的结构,不仅减少了语音跟踪中的延迟问题,还使用强制对齐生成了地面真实文本与读音之间的训练信号,实验结果表明这种方法能够在不同数据集上以高精确度跟踪成人和儿童的语音。