本文中我们提出了基于深度神经网络和循环神经网络的空间选择性滤波器 (SSF),在多扬声器多声道分离任务中,可以从混合信号中提取出特定说话者的声音信息,并与直接分离方法进行了比较。结果表明,SSF 具有更好的空间信息利用和泛化能力。
Apr, 2023
本文研究单通道源信号分离问题,着重于周期稳态信号,提出一种基于 U-Net 架构的深度学习方法,该方法可以接近最优性能,且具有较小的计算负担。
Aug, 2022
采用 DenseNet 架构的音频源分离方法在 SiSEC 2016 竞赛中表现优异,具有更好的信号失真比和更少的参数、更短的训练时间。
Jun, 2017
混合经典数字信号处理 / 深度神经网络的方法用于源分离任务,通过设计合理的潜在空间,将单通道欠定的源分离问题转化为等效的多通道过定的问题,并使用变分块间分离表征混合信号,通过经典信号处理理论结果的启发,提出可靠性更强、过拟合风险降低的模型。
Feb, 2024
本论文提出了一种基于对抗生成网络和优化算法的合成 - 分解方法,可用于单通道信号分离和反卷积,能够识别混合信号中的各个源,实现了峰值信噪比的提高。
Jun, 2019
本文提出了一种神经方法,用于远程语音识别(DSR),它能够在没有隔离信号的监督情况下,同时分离和解麦克风混合的语音,并没有未知数量的活跃说话者。
Jun, 2024
本文提出了一种无监督的基于模型的深度学习方法,用于音频源分离,该方法通过参数化源过滤器模型对每个源进行建模,并使用神经网络以基本频率估计源模型的参数来重构观察到的混合音频信号,实验证明该方法具有较高的数据效率和好的分离效果。
Jan, 2022
该研究探索了使用掩蔽函数和深度递归神经网络进行单声道源分离任务(包括单声道语音分离,单声道歌唱声分离和语音去噪)的联合优化。与现有模型相比,我们的方法在评估数据集中的任务中表现良好,并实现了较大的音频性能提升。
Feb, 2015
本文介绍了一种神经网络,可以代替非负矩阵分解(NMF),并进一步展示如何用它实现监督源分离。由于这种方法的可伸缩性,我们展示了如何实现比 NMF 方法更好的源分离性能,以及提出了多种可用于进一步提高性能的衍生结构。
Sep, 2016
利用深度神经网络和特征值方法识别具有相干和非相干源的信号中的源数,并证明其性能优于 AIC 和 MDL 方法。
Sep, 2019