Oct, 2022

用于少样本文本转语音说话人自适应的剩余适配器

TL;DR本研究提出了一种参数高效的少样本说话人自适应方法,通过使用可训练轻量级模块 (residual adapters) 来增加骨干模型 (backbone model) 实现对各种目标说话人的共享,可以在保持语音自然性和说话人相似性的同时仅使用上亿模型参数的 0.1%。