Nov, 2021

RAVE: 一种快速高质量神经音频合成的变分自编码器

TL;DR本文介绍了一种实时音频变分自动编码器 (RAVE),允许快速且高质量的音频波形合成,采用多频段分解处理原始波形。通过后训练分析潜在空间,实现重构保真度与表示紧凑性之间的直接控制。例如对于音质转换和信号压缩等应用,该模型相比于现有模型表现更优。