Jan, 2025

AnCoGen:通过掩码自编码器分析、控制和生成语音

TL;DR该研究提出了一种新方法AnCoGen,通过一个统一模型利用掩码自编码器对语音信号进行分析、控制和生成。其创新点在于通过估计说话者身份、音高、内容、响度、信噪比和清晰度指数等关键属性,实现语音的精确控制和生成。研究结果表明,AnCoGen在语音分析重合成、音高估计、音高修改和语音增强方面效果显著。