ACLJun, 2024
无文字自学习蒸馏的噪声鲁棒感情语音对语音翻译模型
Textless Acoustic Model with Self-Supervised Distillation for Noise-Robust Expressive Speech-to-Speech Translation
Min-Jae Hwang, Ilia Kulikov, Benjamin Peloquin, Hongyu Gong, Peng-Jen Chen...
TL;DR提出了一种文本无关的声学模型与自我监督蒸馏策略相结合的噪声鲁棒表达式语音翻译 (S2ST) 模型,通过将 U2S 生成器与语音到单元翻译模型级联,可以在存在噪声的环境中生成高质量的语音,并在干净环境中保持竞争性性能。