本文提出采用基于感知度量的新损失函数的神经网络策略来进行端到端的语音源分离任务,实验表明这些新的损失函数能够帮助达到比基于 MSE 和 SDR 成本函数独自使用更优异的分离性能。
Jun, 2018
本文提出了一种新的无监督算法损失函数,称为混响作为监督(RAS),使用两个信道的混合信号,训练神经网络以分离源,并通过维纳滤波器来评估所分离出的混响信号。实验结果表明,相对于只使用已标注数据和使用完整数据的有监督算法,本方法在只有 5% 到 10% 的标注数据时可以获得可观的性能优越性。
Nov, 2022
本文提出了一种神经方法,用于远程语音识别(DSR),它能够在没有隔离信号的监督情况下,同时分离和解麦克风混合的语音,并没有未知数量的活跃说话者。
Jun, 2024
本文提出了基于信噪比的鲁棒 SNR 距离度量方法,旨在适用于深度度量学习,比欧氏距离度量方法具有更好的性能,并配合 DSML 模型和深度哈希方法获得了当前最先进的方法。
Apr, 2019
本文介绍了 2018 年社区无损音频分离评估活动的组织和结果,该活动旨在推进机器学习时代音频分离软件的原型设计。本次活动通过发布音乐分离数据库 MUSDB18,以及发布开源软件和 Python 版本的 BSSEval 工具箱,来向参与者展示了在三种理论分离方法下的性能表现。
Apr, 2018
提出了一种基于扩散生成模型的分离叠加源的新方法,通过最大后验估计和多重水平的高斯平滑指导下的 α 后验来建立新的目标函数,应用于射频系统,旨在恢复编码比特,实验结果表明,相比于经典和现有学习方法,我们的方法可以将误码率降低 95%。
Jun, 2023
本研究评估了 PSRN(峰值信噪比)作为图像分割算法质量指标,结果表明 PSRN 并非适当的算法质量度量。
May, 2016
本文提出了一种基于深度神经网络的源分离的两阶段训练方案,第一步学习将信号转换为使掩蔽分离性能最优的潜在空间,第二步训练在学习空间中操作的分离模块,并使用了一个可缩放失真比的 SI-SDR 损失函数来证明优化效果。通过各种声音分离实验,该方法可以比联合学习变换和分离模块的系统获得更好的表现。
Oct, 2019
本篇研究探讨了音乐源分离中的各种损失函数,旨在确定哪种损失函数提供更好的分离效果。通过对多种音频源分离损失进行调查和实验控制来评估它们,并探索使用这些损失作为评估指标。此外,研究了基于这些损失的替代评估指标,以纠正标准信噪比指标在某些情况下可能误导人的情况。
Feb, 2022
本文研究从噪声带限数据中恢复点源的叠加。我们仅仅了解一个物体在由某个截止频率限制的低频段的频谱,通过将频谱外推到更高频率来获得更高分辨率的估计。我们证明只要源之间相隔大于截止频率的两倍的倒数,求解一个简单的凸优化问题就可以在稳定的意义下产生一个估计,其中高分辨重建与真实值之间的逼近误差与噪声水平乘以超分辨因子(SRF)的平方成比例。
Nov, 2012