Jul, 2024

关于不同自动语音识别架构中纯合成训练数据的影响

TL;DR本研究解决了合成数据在自动语音识别(ASR)训练中的有效性问题。通过使用合成的文本到语音系统(类似于FastSpeech-2),我们探讨了ASR模型对合成数据的敏感性,特别是通过不同的发音嵌入和模型规模的变化。研究结果表明,合成数据与真实数据之间的表现差距可以通过合理的模型调整得到改善,为ASR系统的训练方法提供了新的见解。