Dec, 2023
基于 BLSTM 的端到端语音识别置信度估计
BLSTM-Based Confidence Estimation for End-to-End Speech Recognition
Atsunori Ogawa, Naohiro Tawara, Takatomo Kano, Marc Delcroix
TL;DR本研究利用双向长短时记忆(BLSTM)模型进行自动语音识别(ASR)中的可信度估计,通过利用多种 ASR 解码得分作为辅助特征,该模型在高度不平衡的情况下稳定展现出高可信度估计表现,并且大幅优于基于 Transformer 的可信度估计模型。