Mar, 2024

语音语言模型的规模特性

TL;DR本文使用语言模型的扩展性行为来估计目前方法在训练中使用的计算规模下,会产生具有类似基于文本的大型语言模型的英语熟练度的语音语言模型。我们展示了语言模型和大型语言模型的预训练损失与下游句法和语义性能之间存在强相关性,从而导致语言性能的可预测扩展。我们还表明,与基于文本的大型语言模型相比,语音语言模型的语言性能扩展速度慢三个量级。此外,我们研究了旨在提升语义理解的合成数据的益处以及更粗糙的语音分词的影响。