Oct, 2023

语音转换给口吃的语言,乐器,未知语言和文本描述的声音转换

TL;DR使用 k 最近邻声音转换模型,调查其在非标准下游语音转换任务中的表现,包括口吃声转换、跨语言声音转换、乐器转换和文本转语音转换。与基准线方法相比,k 最近邻声音转换在口吃声转换和跨语言声音转换中保持高性能,但在乐器转换和文本转语音转换任务中表现有所不同。然而,这表明声音转换模型,尤其是 k 最近邻声音转换,在各种非标准下游任务中逐渐具有应用价值,但在与训练分布相差较大的样本上仍存在一些限制。