基于移动网络的虚拟会议语音增强
本文提出了一种适用于 VoIP 应用的深度噪声抑制模型的微调方法,并通过使用多任务学习框架联合优化噪声抑制和特定于 VoIP 的声学,表明该方法优于行业绩效和最先进的语音增强方法,并展示了 DNS-2020 模型在不同 VoIP 平台上具有潜在优化的潜力,这些发现在语音识别、语音助手和通信等领域具有重要应用。
Mar, 2023
Deep Noise Suppression Challenge aims to improve speech quality through open-sourced datasets and evaluation frameworks using two tracks focused on real-time denoising for wideband and full band scenarios, as well as making available a reliable objective speech quality metric called DNSMOS.
Jan, 2021
本研究旨在促进噪声抑制技术的创新,提高感知语音质量。通过在 INTERSPEECH 2020 会议上举行 Deep Noise Suppression Challenge 特别会议以及开源训练和测试数据集,来推动该领域的研究。挑战赛分为两个方向,一个专注于实时去噪,另一个专注于实时个性化深度噪声抑制。我们还提供了一种非侵入式的客观语音质量指标 DNSMOS,在开发阶段供参与者使用,最终评估将基于主观测试。
Sep, 2020
介绍了交互式语音技术协会 2020 年举办的深度噪声抑制挑战赛,通过提供大规模干净语音和噪声语料库对话音频,以及基于 ITU-T P.808 的在线主观测试框架,比较了不同算法的噪声抑制效果。
May, 2020
本文研究深度学习模型在语音增强方面的应用,并探讨了网络复杂度与可达到的语音质量之间的关系,考虑了网络在回声环境下的训练。研究表明,网络的复杂度是影响语音质量的一个重要因素。
Jan, 2021
本研究提出了一种可以按任意讲话者数量、噪声类型和语音信噪比水平进行横向扩展的 MS-SNSD 有噪语音数据集,在这个基础上,研究者们推出了开源的评估方法,通过客观质量衡量标准和主观意见评分相互印证提升了 语音增强算法的性能。
Sep, 2019
本研究提出了一种基于深度学习和数字信号处理混合的方法来实现噪声抑制,该方法使用了四层隐含层的深度神经网络来估计关键频带增益,并采用传统的基音滤波器抑制谐波之间的噪声,相比于传统的最小均方误差谱估计,该方法获得了显著更高的质量,在复杂度低到足以实现 48kHz 实时处理的低功耗处理器上。
Sep, 2017
提出了一个基于噪声感知的训练框架,将增强语音引入到声学模型的多条件训练中,通过两个级联的神经结构来优化增强语音和语音识别,并取得了较好的实验结果。
Mar, 2022