May, 2023

用生成对抗网络加强有缺口的语音音频信号

TL;DR利用机器学习技术,将音频转换成 Mel 频谱图进行图像修复来填补音频中长达 320ms 的缺失区域并且实现了转换回音频流,同时在 LJSpeech 数据集上展示出实时性能。