May, 2023

文本预训练的语音语言模型

TL;DR该研究提出了 TWIST 方法,利用预训练的文本语言模型进行暖启动,从而训练语音语言模型,实验结果表明 TWIST 方法在多个方面胜过冷启动方法。基于观察结果,研究团队提出了迄今为止最大的 SpeechLM,并引入了两个口语版的 StoryCloze 文本基准来进一步改进模型评估和推动未来研究进展。