Oct, 2023

Spatial HuBERT:基于多通道音频的自监督单讲话者空间语音表征学习

TL;DRSpatial HuBERT 是一种自我监督的语音表示模型,通过使用多通道音频输入学习单个说话者在潜在嘈杂环境中的声学和空间信息,可以在多种空间下游任务中优于最先进的单通道语音表示,在混响和嘈杂环境中表现出色。