Jan, 2024
增强本地性动态偏置和采样策略用于上下文自动语音识别
Locality enhanced dynamic biasing and sampling strategies for contextual ASR
Md Asif Jalal, Pablo Peso Parada, George Pavlidis, Vasileios Moschopoulos, Karthikeyan Saravanan...
TL;DR通过分析不同的采样策略和相关性图,本文首先对上下文偏置模块的训练进行了探究。其次,引入了邻居注意力机制来进一步优化上下文偏置的输出,实验结果表明相对于基准模型,在 LibriSpeech 数据集和稀有单词评估上平均相对词错误率提升了 25.84%。