Oct, 2023

RIR-SF:基于房间冲激响应的多通道多说话人 ASR 的空间特征

TL;DR通过将重叠的语音信号与目标讲话者传输到麦克风阵列的房间冲激响应(RIR)进行卷积,引入了一种创新方法,得到了一种称为 RIR-SF 的新型空间特征。理论分析和实验结果均证实了该方法相对于现有方法的优越性,通过在多通道多讲话者 ASR 系统中实现 CER 的显著 21.3%的相对减小来表明了 RIR-SF 的超越性,重要的是,这种新特征在强混响环境下表现出稳健性,超越了以往方法的限制。