Apr, 2023

Pac-HuBERT: 基于原始听觉聚类和隐藏单元 BERT 的自监督音乐源分离

TL;DR本研究提出了一种基于自监督学习和 HuBERT speech representation 模型的音乐源分离框架,结合 Demucs V2 和 Res-U-Net 解码器,使用自由音乐库(FMA)数据集进行预训练,实现了比原始 Demucs V2 和 Res-U-Net 模型更好的源 - 失真比(SDR)表现,并可以在少量监督数据的情况下提升性能。