Jun, 2019

MelNet: 频域音频生成模型

TL;DR利用二维时频表示,概率模型和多尺度生成,设计了一个能够捕捉高时间尺度结构的模型,可以在各种音频生成任务中达到比以往更好的效果。