Sep, 2024

通过内部声学模型训练和双空白阈值提升基于混合自回归转导器的语音识别

TL;DR本研究解决了混合自回归转导器(HAT)在语音识别中的效率和精度不足的问题。我们提出了一种新的内部声学模型(IAM)训练策略,以提高HAT的训练效率,并结合双空白阈值技术,从而在不显著降低识别性能的情况下实现42-75%的解码速度提升。