May, 2023
基于实体感知模型和音素相似度评估的升降同音词定制语音识别(ASR)系统
Retraining-free Customized ASR for Enharmonic Words Based on a Named-Entity-Aware Model and Phoneme Similarity Estimation
Yui Sudo, Kazuya Hata, Kazuhiro Nakadai
TL;DR本文提出了一种基于实体感知的端到端自动语音识别模型和音素相似度估计的重新训练自由式定制方法,用于解决处理同音字的特定问题,实验结果表明,相对于传统的 E2E-ASR 模型,该方法在处理个人姓名作为目标实体时,平均改善了目标实体字符误差率 35.7%。