Jul, 2024

探究大规模伪立体数据和不同语音基础模型对对话生成式口语模型的影响

TL;DR将单声道对话数据转化为伪立体声数据,通过增加训练数据集的丰富性和质量,有效改善口语对话语言模型的性能,并探索使用不同语音基础模型的离散单元进行口语对话生成。