Jun, 2024
通过同时关注声音和置信度引用进行自动语音识别的错误修正
Error Correction by Paying Attention to Both Acoustic and Confidence
References for Automatic Speech Recognition
TL;DR提出了一种非自回归的语音错误纠正方法,利用置信度模块和音频特征从自动语音识别假设中准确定位错误,采用交叉注意机制融合错误纠正参考和自动语音识别假设,并在实验中显示出音频和置信度参考能够帮助错误修正,该系统与自动语音识别模型相比减少了21%的错误率。