Sep, 2024

语言模型感知的语音分词

TL;DR本研究针对当前语音分词与语言模型之间的匹配问题,提出了一种新的训练方法,利用预训练文本语言模型的目标来优化语音表示的学习过程。实验结果表明,该方法在语音语言建模和语音转文本任务上优于传统基线,并且能够使用单一的预训练语言模型处理语音和文本输入,提供了更高效的解决方案。