Oct, 2021

神经分析与合成:基于自监督表示重构语音

TL;DR提出了一种神经分析合成(NANSY)框架,它可以操作任意语音信号的声音、音高和速度,通过使用信息扰动提出了一种新的训练策略,使 NANSY 具有高重构质量和可控性,不需要任何瓶颈结构,使用全自监督训练方式,可以在多个应用领域获得显著的性能提升。