该研究提出了一种基于非因果的扩张卷积和预测目标场而不是单个目标样本的、采用监督学习方式最小化回归损失的判别式模型适应方法,旨在进行语音去噪处理,比传统幅度谱法的维纳滤波法具有更好的计算性能和感知评估效果。
Jun, 2017
本文研究了基于深度学习的语音增强中的连续建模方法,重点关注降噪过程。通过引入一个状态变量来表示降噪过程,训练中使用类似 UNet 结构的神经网络学习估计连续降噪过程中的每个状态变量,测试时引入一个控制因子作为嵌入,可调整噪声削减水平。该方法可以实现可控语音增强,并适用于不同的应用场景。实验结果显示,在清晰目标中保留少量噪声有助于语音增强,从客观语音指标和自动语音识别性能的改善来验证。
Sep, 2023
本研究提出了一种基于深度学习和数字信号处理混合的方法来实现噪声抑制,该方法使用了四层隐含层的深度神经网络来估计关键频带增益,并采用传统的基音滤波器抑制谐波之间的噪声,相比于传统的最小均方误差谱估计,该方法获得了显著更高的质量,在复杂度低到足以实现 48kHz 实时处理的低功耗处理器上。
Sep, 2017
一种创新的方法用于在资源受限设备上实时语音增强的深度神经网络计算复杂度的减少,该方法利用两阶段处理框架,采用通道特征重定向来降低卷积运算的计算负荷,并结合改进的功率定律压缩技术以实现与最先进方法相当的噪声抑制性能,但具有显著较少的计算要求。值得注意的是,我们的算法的计算复杂度和内存使用比之前最先进的方法要少 3 到 4 倍。
Dec, 2023
本研究提出使用生成对抗网络进行语音增强,通过训练模型使其在波形级别对 28 个说话人和 40 种不同噪声条件进行增强,目的是解决当前技术只能处理少量特定噪声条件和依赖于一阶统计量的问题,实验证明该模型的可行性和有效性,未来可以进一步探索生成性结构用于提高语音增强的性能。
Mar, 2017
本研究旨在通过特征去噪的方式提高卷积神经网络在对抗攻击下的鲁棒性,实验结果表明这种方法对提高白盒和黑盒攻击下的分类准确率具有一定效果。
Dec, 2018
本文阐述了使用非常深的卷积神经网络对嘈杂语音进行有效识别的优化策略,并且结合辅助特征共同使用能够进一步提高准确率。在 Aurora 4 任务中,该算法的词错误率达到了 7.09%。
Oct, 2016
本文提出了一种基于去噪声码器的语音增强方法,利用自监督学习获取语音的相关特征,并采用最佳的自监督学习配置,采用对抗训练方式进行声音去噪,最终实现了一种具备实时能力、优化了客观指标并超越了当前最先进的语音增强模型的方案。
Nov, 2022
通过卷积神经网络,我们提出了一种新的盲目图像降噪 CNN 架构,该架构综合了三个架构组件,包括多尺度特征提取层,l_p 规范化器以及三步训练方法,并与现有方法相比表现出具有竞争力的降噪性能。
Aug, 2017
本研究提出了 DenoiSpeech 系统,它可以处理具有高噪声变异的实际世界噪声,使用细粒度的帧级噪声建模噪声条件模块与 TTS 模型共同训练,实验结果表明,DenoiSpeech 在真实环境数据上的性能要优于之前提出的两种方法 0.31 和 0.66 MOS。
Dec, 2020