May, 2024

SeamlessExpressiveLM: 链条思维情感语言模型用于表达性语音到语音翻译

TL;DR提出了SeamlessExpressiveLM,一个用于表情化语音到语音翻译的单一语言模型,通过分解复杂的源到目标语音映射为中间生成步骤,并结合思维链引导模型,实现了在西班牙语到英语和匈牙利语到英语翻译中优于级联语言模型的语义质量和风格转移效果,同时实现了更好的参数效率。