关键词code-switched speech recognition
搜索结果 - 2
- 使用语言模型的语言切换语音识别:古吉拉特英语
通过条件化变换器层上的语言 ID,我们提出了两种引入语言特定参数和可解释性以及实现辅助性的时间损失方法,以改进端到端自动语音识别模型的性能。尽管无法显著减少词错误率,但我们的方法在通过仅仅的口语数据预测正确语言方面表现出潜力。我们通过在序列 - 发掘 Web 规模语音模型的潜在能力,实现零样本任务的普适性
本文通过调整 Prompt 的方式,从三个任务 (音视频语音识别、混合语音识别、语音翻译) 入手,探究了该模型 Whisper 的应用性能。实验证明,相对于默认 Prompt,本文提出的 Prompt 在零 - shot 任务上的表现提升了