Oct, 2020

实时语音频带扩展

TL;DR本文提出了一种轻量级模型,可以将采样频率从 8kHz 提高到 16kHz,并使用 SEANet 模型结构和特征损失和对抗损失的组合方法,将高频内容恢复到与 16kHz 接近的水平,并且该模型在流模式下具有较低的延迟,可在双向语音通信系统中实现。