ICLROct, 2021

基于块的自回归 GAN 用于条件波形合成

TL;DR本研究提出了一种新的音频合成模型 Chunked Autoregressive GAN (CARGAN),它能够在保持较快的生成速度的同时减少漏洞,并且利用自回归的方法来学习瞬时频率和相位之间的关系,使其在有条件的生成音频方面有更好的表现,同时适合于实时或交互式应用。