Aug, 2024
通过上下文化提高基于大语言模型的语音识别能力以识别稀有和模糊词汇
Enhancing Large Language Model-based Speech Recognition by
Contextualization for Rare and Ambiguous Words
TL;DR本研究解决了语音识别系统在处理稀有和模糊词汇时的准确性不足问题。通过在文本提示中提供关键词作为先前信息,作者提出了一种新的自回归解码架构,能够在不修改模型架构的情况下对模糊词进行准确转录。实验结果表明,该方法显著提高了罕见和模糊词汇的识别性能。