Oct, 2022

高保真神经音频压缩

TL;DR利用神经网络技术,提出了一种先进的实时高保真音频编解码器,其采用流式编解码器结构和量化的潜在空间,并引入了一种新型损失平衡机制和轻量级 Transformer 模型用于压缩。在语音、噪声回声语音和音乐等多个音频领域测试中,该方法在所有评估指标下均优于基线方法。