Jul, 2024
探究大规模伪立体数据和不同语音基础模型对对话生成式口语模型的影响
Investigating the Effects of Large-Scale Pseudo-Stereo Data and Different Speech Foundation Model on Dialogue Generative Spoken Language Model
Yu-Kuan Fu, Cheng-Kuang Lee, Hsiu-Hsuan Wang, Hung-yi Lee
TL;DR将单声道对话数据转化为伪立体声数据,通过增加训练数据集的丰富性和质量,有效改善口语对话语言模型的性能,并探索使用不同语音基础模型的离散单元进行口语对话生成。