BriefGPT.xyz
Ask
alpha
关键词
reverberant environments
搜索结果 - 4
多麦克风语音情感识别采用分层令牌-语义音频 Transformer 架构
研究探索多麦克风信号处理以提高情感分类准确性,并通过采用分层令牌语义音频变换器模型在现实环境中的测试,获得优越的性能。
PDF
a month ago
Spatial HuBERT:基于多通道音频的自监督单讲话者空间语音表征学习
Spatial HuBERT 是一种自我监督的语音表示模型,通过使用多通道音频输入学习单个说话者在潜在嘈杂环境中的声学和空间信息,可以在多种空间下游任务中优于最先进的单通道语音表示,在混响和嘈杂环境中表现出色。
PDF
9 months ago
时空神经滤波器:方向感知的端对端多通道目标语音分离
本文提出了一种时空神经滤波器,通过方向信息的辅助作用,从具有混响的多人语音混合物中直接估计目标语音波形,以提高目标和干扰源之间的时域、频域和空域可辨识度,并设计了一种全卷积自动编码器框架用于快速和端到端的语音分离处理。
PDF
5 years ago
从原始波形开始的端到端双耳声音定位
本研究提出了一种新方法,采用卷积神经网络从声波波形中直接估计声源的方位,利用一组特定的卷积核搜索局部化线索,我们的实验表明该方法能够在多种情境下提高声音定位精度。
PDF
5 years ago
Prev
Next