Sep, 2023

Whisper 能否进行基于语音的上下文学习

TL;DR通过以语音为基础的上下文学习方法,本研究调查了由 OpenAI 发布的 Whisper 自动语音识别(ASR)模型的上下文学习能力。在应用于孤立词 ASR 时,实验结果表明使用任意大小的 Whisper 模型在两种方言中能够显著减少词错误率(WER),平均降低率为 32.3%。可应用于进一步提高上下文学习效率的基于 k 最近邻的示例选择技术能将平均相对 WER 减少率提高至 36.4%。研究还对发音变化和方言特定的词汇细微差别的适应性进行了详细的定量分析。