BriefGPT.xyz
Ask
alpha
关键词
speech dereverberation
搜索结果 - 3
AV-RIR:音频 - 视觉房间冲激响应估计
准确估计室内脉冲响应(Room Impulse Response,RIR)对于语音处理和增强实境 / 虚境应用非常重要。本文提出了 AV-RIR,一种新颖的多模态多任务学习方法,能够准确从给定的回声语音信号和对应环境的视觉线索中估计 RIR
→
PDF
7 months ago
基于频域自回归建模的语音增强
通过自回归(AR)模型在子带语音信号的频域中分离包络和载波部分,提出了一种改善语音质量和 ASR 性能的语音去混响统一框架,设计了基于双路径长短期记忆(DPLSTM)模型的神经网络结构,实现改善了子带包络和载波组件,进一步通过联合学习网络权
→
PDF
9 months ago
基于生成对抗网络的语音去混响方法研究,用于增强语音识别鲁棒性
本文探讨了生成式对抗网络在语音去混响中的应用及其提高语音识别性能的优势,通过实验发现将 LSTM 与深度残差网络相结合可达到 16% 的语音识别误差率相对下降。
PDF
6 years ago
Prev
Next