Mar, 2022

利用自注意力通道组合的远场 ASR 空间处理前端

TL;DR提出了一种基于多通道前端与加权预测误差方法、定向最小方差冲束形成器和基于自注意力的通道合并方案的 ASR 系统,结合 ContextNet 系统,相比其他 ASR 系统在多通道语音识别问题上取得了更好的效果,并验证了前置去混响和改进的神经通道缩短方法带来的益处,同时探讨了 C50 声信噪比的评估和权重的意义。