Marco Gaido, Yun Tang, Ilia Kulikov, Rongqing Huang, Hongyu Gong...
TL;DR本文探讨了如何利用在特定环境下出现的命名实体词典来提高语音转文本模型的准确性, 实验证明使用 NE 词典可以有效提高命名实体的准确性,降低人名错误率达 31%。
Abstract
In a sentence, certain words are critical for its semantic. Among them, named
entities (NEs) are notoriously challenging for neural models. Despite their
importance, their accurate handling has been neglected in speech-to-text (S2T)
translation research, and recent work has shown that
本文介绍了一种建立在双向编码器变换器(BERT)架构上的命名实体识别(NER)模型的方法,具体使用了 SlovakBERT 模型。该 NER 模型从语音转文本转录获取的数据中提取地址部分。由于真实数据的稀缺性,使用 GPT API 生成了一个合成数据集。强调了在这种人工数据中模仿口语变异的重要性。我们的 NER 模型仅使用合成数据进行训练,并使用小型真实测试数据集进行评估。