COLINGNov, 2020

利用字符串和语音相似性的神经文本标准化

TL;DR本研究提出了神经模型,利用单词字符串和音相似性来进行文本规范化。结论表明,将单词字符串的相似性与声音相似性综合考虑,能成功应对缩写、拼写错误和语音替代等问题,并达到了比基础模型更高的 F1 得分。