Jul, 2024

利用LLM生成的上下文描述改善特定领域的自动语音识别

TL;DR本研究针对现有端到端自动语音识别系统在识别特定领域词汇(如专有名词和技术术语)方面的不足,提出了一种利用最新的Whisper模型,并结合描述生成和解码器微调等新颖训练方法的改进方法。实验证明,这种方法显著提高了特定领域ASR的准确性,且LLM生成的描述在有效性上优于人工撰写的描述。