SDR - 半熟还是熟透了？ | BriefGPT

Nov, 2018

SDR - 半熟还是熟透了？

SDR - half-baked or well done?

Jonathan Le Roux, Scott Wisdom, Hakan Erdogan, John R. Hershey

TL;DR该研究提出了一种简单、更稳健的量化语音增强和源分离算法的质量评估方法 —— 尺度不变的信噪比评估标准（SI-SDR），并且通过大量实验证明其优越性，相较于 BSS_eval 工具箱所采用的信噪比评估标准（SDR），SI-SDR 更为牢固、稳定

Abstract

In speech enhancement and source separation, signal-to-noise ratio is a ubiquitous objective measure of denoising/separation quality. A de

speech enhancement source separation signal-to-noise ratio bss_eval toolkit si-sdr

发现论文，激发创造

端到端语音分离的基于性能的成本函数

本文提出采用基于感知度量的新损失函数的神经网络策略来进行端到端的语音源分离任务，实验表明这些新的损失函数能够帮助达到比基于 MSE 和 SDR 成本函数独自使用更优异的分离性能。

Jun, 2018

混响作为语音分离监督

本文提出了一种新的无监督算法损失函数，称为混响作为监督（RAS），使用两个信道的混合信号，训练神经网络以分离源，并通过维纳滤波器来评估所分离出的混响信号。实验结果表明，相对于只使用已标注数据和使用完整数据的有监督算法，本方法在只有 5% 到 10% 的标注数据时可以获得可观的性能优越性。

Nov, 2022

远场语音识别的神经盲分离和发言者划分

本文提出了一种神经方法，用于远程语音识别（DSR），它能够在没有隔离信号的监督情况下，同时分离和解麦克风混合的语音，并没有未知数量的活跃说话者。

Jun, 2024

信噪比：深度度量学习的鲁棒距离度量

本文提出了基于信噪比的鲁棒 SNR 距离度量方法，旨在适用于深度度量学习，比欧氏距离度量方法具有更好的性能，并配合 DSML 模型和深度哈希方法获得了当前最先进的方法。

Apr, 2019

2018 年信号分离评估活动

本文介绍了 2018 年社区无损音频分离评估活动的组织和结果，该活动旨在推进机器学习时代音频分离软件的原型设计。本次活动通过发布音乐分离数据库 MUSDB18，以及发布开源软件和 Python 版本的 BSSEval 工具箱，来向参与者展示了在三种理论分离方法下的性能表现。

Apr, 2018

基于评分的信号源分离及其在数字通信中的应用

提出了一种基于扩散生成模型的分离叠加源的新方法，通过最大后验估计和多重水平的高斯平滑指导下的 α 后验来建立新的目标函数，应用于射频系统，旨在恢复编码比特，实验结果表明，相比于经典和现有学习方法，我们的方法可以将误码率降低 95％。

Jun, 2023

PSNR 评估在图像分割算法中的质量测量参数的正式评估

本研究评估了 PSRN（峰值信噪比）作为图像分割算法质量指标，结果表明 PSRN 并非适当的算法质量度量。

May, 2016

训练学习的潜在目标，进行两步声源分离

本文提出了一种基于深度神经网络的源分离的两阶段训练方案，第一步学习将信号转换为使掩蔽分离性能最优的潜在空间，第二步训练在学习空间中操作的分离模块，并使用了一个可缩放失真比的 SI-SDR 损失函数来证明优化效果。通过各种声音分离实验，该方法可以比联合学习变换和分离模块的系统获得更好的表现。

Oct, 2019

关于音乐源分离的损失函数和评估指标

本篇研究探讨了音乐源分离中的各种损失函数，旨在确定哪种损失函数提供更好的分离效果。通过对多种音频源分离损失进行调查和实验控制来评估它们，并探索使用这些损失作为评估指标。此外，研究了基于这些损失的替代评估指标，以纠正标准信噪比指标在某些情况下可能误导人的情况。

Feb, 2022

噪声数据下的超分辨率

本文研究从噪声带限数据中恢复点源的叠加。我们仅仅了解一个物体在由某个截止频率限制的低频段的频谱，通过将频谱外推到更高频率来获得更高分辨率的估计。我们证明只要源之间相隔大于截止频率的两倍的倒数，求解一个简单的凸优化问题就可以在稳定的意义下产生一个估计，其中高分辨重建与真实值之间的逼近误差与噪声水平乘以超分辨因子（SRF）的平方成比例。

Nov, 2012