Jan, 2024

SpeechComposer: 统一多个语音任务的提示组合

TL;DR该研究中提出了一种名为SpeechComposer的新型仅解码语音语言模型,通过组合一组固定的提示标记,可以统一常见的语音任务,从而改进了基准模型的性能。