Jan, 2024

通过自监督表示混合和嵌入初始化最大化跨语言 TTS 适应的数据效率

TL;DR本文介绍了一种有效的迁移学习框架,用于在文本转语音系统中进行语言适应,重点是通过使用尽可能少的标记和未标记数据实现语言适应。实验结果表明,我们的框架能够仅使用 4 个标记数据和 15 分钟未标记数据合成未知语言的可懂语音,还能在可获得更多数据的情况下超越传统技术,凸显了我们的高效语言适应框架的潜力。