ICLRNov, 2018

TimbreTron: 一种用于音乐音色转移的 WaveNet (CycleGAN (CQT (Audio))) 管道

TL;DR本文介绍一种名为 TimbreTron 的音乐音色转换方法,它使用基于图像领域的风格转移技术,将音频信号的时频表示进行转换,然后使用有条件的 WaveNet 合成器生成高质量的波形。我们还介绍了 Constant Q Transform (CQT) 表示法,它在人类知觉评估中可确保转移音色,同时保留其他音乐内容,适用于卷积架构。