Sep, 2023

通过语言提示调整和帧级别语言适配器增强多语言语音识别

TL;DR提出了两种简单和参数高效的方法:语言提示调优和帧级语言适配器,用于分别增强可配置语言和语言无关的多语言语音识别,同时探索了使用参数高效的微调方法整合这两种方法的可行性。实验证明了我们提出的方法在七种语言下均具有显著的性能提升。