EMNLPNov, 2023

检索与复制:将 ASR 个性化扩展至大规模目录

TL;DR针对自动语音识别模型的个性化问题,我们提出了一种 “检索和复制” 机制和训练策略,以改善稀有词汇和特定领域实体的识别精度,实验结果显示与基线相比,我们的方法在词错误率降低 6%,F1 得分提高 3.6%,且在每个声学帧至少提升 20% 推理速度的同时可容纳多达 20K 的大型目录。