Aug, 2023

SpeechTokenizer: 面向大型语音模型的统一语音分词器

TL;DR通过对语音令牌进行编码解码架构的统一建模和分层信息表征,提出了 SpeechTokenizer,用于语音大型语言模型的训练,其在语音重构和零样本语音合成任务中表现出色,相较于传统的语义和声学令牌在建模效果上有显著优势。