ACLJul, 2020

医学 ASR 标点及大小写预测的稳健性

TL;DR本论文提出了一种基于预训练掩码语言模型,如 BERT、BioBERT 和 RoBERTa 的条件联合建模框架,用于预测标点符号和大小写,并介绍了域和任务特定自适应技术和数据增强方法,可提高医学领域 ASR 系统输出的识别准确率。实验结果表明,所提出的模型在字典和会话样式语料库上,相对于基线模型,F1 度量下实现了~5% 的绝对改进和~10% 的 ASR 输出优化。