Jun, 2023

基于转录器的流式语音识别中的自适应上下文偏置

TL;DR提出了一个基于上下文感知的变形器转录方法的自适应上下文偏置方法,通过使用有偏的编码器和预测器嵌入来执行流媒体预测,动态地开关偏差列表,以适应个性化和常见情况,实验证明相对于基线,它可以在常见情况下减少 WER 和 CER 达到 6.7%和 20.7%,在个性化情况下对性能影响极小,同时保持快速的推理管道。