stft | BriefGPT - AI 论文速递

关键词stft

搜索结果 - 5

探索基于时域卷积网络的 DNN 语音增强的最佳损失函数
本文比较了基于短时傅里叶变换和时间域音频分离网络的两种不同的语音增强算法在不同数据集上的效果，提出了利用问题无关语音编码器特征的基于 STFT 的语音增强算法，通过在 Voice Bank+DEMAND 数据集上的实验验证，证明了该方法的有
PDF4 years ago
端到端语音分离的滤波器设计
本文提出复数解析滤波器及其相关表征与掩码策略，进一步拓展了单通道语音分离的滤波器发展，并展示其在嘈杂环境下的优秀性能。同时，基于本文提出的参数化滤波器，对所有情况均证明了复数表征与掩码的优势，并表明了短时傅里叶变换（STFT）在 2ms 窗
PDF5 years ago
通用音频分离
该研究使用深度学习模型进行了基于掩蔽的语音信号增强和分离任务的研究，并尝试将其应用到任意类型混音的分离任务中，即通用声音分离。在此过程中，作者比较了不同的分析合成基础和网络结构，其中长短时记忆网络和时延卷积堆栈是采用时间域增强网络（Conv
PDF5 years ago
ICML使用相位特征改进基于 DNN 的音乐源分离
本文探讨了利用深度神经网络在音乐源分离中仅依赖幅度特征与在加入相位特征后分离性能的提升，提出了一种新的神经网络结构，该结构结合了幅度和相位，实验结果表明，相比仅使用幅度特征的网络，在 DSD100 测试集上使用相位衍生特征能够有效提升音频信
PDF6 years ago
基于展开迭代相位重建的端到端语音分离
本研究提出了一种基于深度学习的端到端方法用于解决单通道无特定说话人的多人语音分离问题，通过利用时间 - 频率的掩蔽，短时傅里叶变换以及它的逆变换嵌入到深层网络中，通过在重建信号上直接计算损失函数来解决之前存在的位移不一致导致的重构误差问题，
PDF6 years ago