Apr, 2024

音乐信息检索中用于音乐流派识别的一种新型音频表示

TL;DR通过将音乐进行深度向量量化,为创新的生成音乐模型 Jukebox 创建了一种新型的音频表示方法,并使用与最先进水平相当的数据集进行比较分析,结果显示 Jukebox 的音频表示方法在预训练使用限定数据集时不如 Mel 频谱图,这可能是因为 Jukebox 的音频表示没有充分考虑到人类听觉感知的特殊性。