Sep, 2023

利用调教的大型语言模型的零射击能力进行端到端语音识别

TL;DR我们提出了一种将指导训练的大型语言模型(LLM)与端到端自动语音识别(ASR)相结合的新方法。该方法利用LLMs的零-shot能力来提取语言信息,从而改善ASR性能,其中包括纠正ASR假设中的语法错误,并利用嵌入的语言知识进行端到端ASR。实验证明,所提出的集成方法能够取得良好的性能改进,并且我们的方法在LLM基于重排序时得到了很大的好处。