Jun, 2024

面向音乐源分离的无关音频轨道限定的单解码器系统

TL;DR提出了使用一个解码器进行多个音频源分离的系统Banquet,通过在与音乐乐器识别模型PaSST配合的询问式设置中扩展了波段分离源分离模型。使用MoisesDB数据集,Banquet在仅仅24.9百万可训练参数的情况下,接近了复杂得多的6个音频源Hybrid Transformer Demucs系统在VDBO音频源上的性能,并在吉他和钢琴上表现出色。询问式设置允许分离狭窄的乐器类别,如清晰的原声吉他,并可成功应用于提取较少常见的音频源,如簧片和风琴。实现可在以上URL链接处获取。