BriefGPT.xyz
Ask
alpha
关键词
multi-channel audio
搜索结果 - 3
Spatial HuBERT:基于多通道音频的自监督单讲话者空间语音表征学习
Spatial HuBERT 是一种自我监督的语音表示模型,通过使用多通道音频输入学习单个说话者在潜在嘈杂环境中的声学和空间信息,可以在多种空间下游任务中优于最先进的单通道语音表示,在混响和嘈杂环境中表现出色。
PDF
9 months ago
多分辨率卷积自编码器实现的原始多通道音频源分离
本研究提出了一种基于多通道,多分辨率卷积自编码神经网络,通过对原始时域信号进行处理以确定适用于从立体声音乐中分离歌唱声的多分辨率特征,实验结果表明该方法可以实现多通道音频源分离,无需任何手工制作的特征或任何预处理或后处理。
PDF
6 years ago
ICLR
多麦克风距离语音识别中的听觉关注循环模型
本文提出了一种神经注意力网络来直接合并多通道音频以生成语音状态,无需任何关于麦克风布置的先前知识或任何用于语音增强的显式信号预处理。
PDF
9 years ago
Prev
Next