本文使用深度学习等方法对音乐进行源分离研究,提出了一种卷积和循环的模型,同时提出了一种新的方法来利用无标签的音乐数据,这些方法比现有的方法表现更好。
Sep, 2019
本文介绍了在音频信号源分离中采用端到端混合模型的方法,该方法使模型决定哪个领域最适合每个源,并将两者结合起来。该方法在 Sony 举办的 2021 年音乐分离挑战中获胜。实验结果表明,该模型在 MusDB HQ 数据集上实现了 1.4dB 的 SDR 改进,并得到了人类主观评价的认可。
Nov, 2021
本论文研究使用端到端模型进行音乐信号源分离,在考虑所有可用信息的基础上实现对原始音频信号(包括相位部分)的源分离。结果表明,我们提出的一种基于 Wavenet 的模型和 Wave-U-Net 的性能都可以优于 DeepConvSep,一个基于谱图的深度学习模型。
Oct, 2018
这篇论文提出了一种基于音频查询的音乐源分离方法,可以通过查询信号明确地编码源信息,以及在无查询条件下生成通过潜空间插值连续输出的分离掩模。
Aug, 2019
本文提出了一种无监督的基于模型的深度学习方法,用于音频源分离,该方法通过参数化源过滤器模型对每个源进行建模,并使用神经网络以基本频率估计源模型的参数来重构观察到的混合音频信号,实验证明该方法具有较高的数据效率和好的分离效果。
Jan, 2022
本文旨在介绍音乐分离的任务以及该任务的两个新的基准数据集,比较流行模型的表现并提供评估排名,同时提供可下载的基准数据集。作者提出了一种使用不同模型进行集成的新方法,并在音乐分离挑战赛中取得了最佳结果,该方法的代码和技术细节已在 GitHub 上公开。
May, 2023
通过借鉴 Hybrid Demucs 架构,本文提出了混合谱图时域音频分离网络(HS-TasNet),结合了频谱和波形域的优势,为实时低延迟的音乐应用展现了高效分离的潜力。
Feb, 2024
提出一种将源分离和最先进的表示学习技术相结合的特征表示方法来优化计算机听觉(即机器听力),在一组挑战性的电子舞曲(EDM)数据集上训练深度可分离卷积神经网络,将其性能与操作源分离和标准光谱图的卷积神经网络进行比较,表明在有限数据环境下,源分离提高了分类性能。
Dec, 2020
本文介绍了一种新的音乐源分离算法,使用对抗训练让分离器的输出更加真实,并取得了对于歌声分离的较好效果。
Oct, 2017
采用 DenseNet 架构的音频源分离方法在 SiSEC 2016 竞赛中表现优异,具有更好的信号失真比和更少的参数、更短的训练时间。
Jun, 2017