BriefGPT.xyz
大模型
Ask
alpha
关键词
single-channel speech enhancement
搜索结果 - 3
Convoifilter:一项关于进行鸡尾酒会话语音识别的案例研究
该论文提出了一种端到端模型,旨在改进在拥挤嘈杂环境中特定讲话者的自动语音识别(ASR)。该模型利用单通道语音增强模块将讲话者的声音与背景噪音隔离,并结合了 ASR 模块。通过这种方法,该模型能够将 ASR 的识别错误率(WER)从 80%降
→
PDF
10 months ago
基于时间域的大脑辅助言语增强网络:在多说话人条件下使用卷积交叉注意力
本研究提出了一种基于脑电图信号的时域单通道语音增强网络(BASEN),用于从混响环境中提取目标讲话者的语音,并且实验结果显示,该方法在多项评估指标上表现优于现有方法。
PDF
a year ago
DeepFilterNet:感知驱动的实时语音增强
本文介绍了使用 DeepFilterNet 进行实时语音增强的演示。通过利用言语生产和心理声学感知的领域知识,该模型能够匹配最先进的语音增强基准,并在单线程笔记本 CPU 上实现了实时化因子 0.19。该框架及预训练权重已在开源协议下发布。
PDF
a year ago
Prev
Next