Jan, 2024

零样本音频情感转换与说话人解缠

TL;DR这篇文章介绍了一种高效的零射击情感风格转换的方法,通过分解语音为语义令牌、说话者表示和情感嵌入,并训练一个解码器来重构语音信号,实现将源语音中的情感内容与目标语音嵌入相结合,同时保留源语音中的说话者和语音内容。