Jul, 2022
利用数据增强改进基于数据驱动的逆文本规范化
Improving Data Driven Inverse Text Normalization using Data Augmentation
Laxmi Pandey, Debjyoti Paul, Pooja Chitkara, Yutong Pang, Xuedong Zhang...
TL;DR本文介绍一种数据增强技术,可有效地从领域外的文本数据生成丰富的口头书面数字对,可用于逆文本规范化模型的训练,通过在所有数字表面上的总精度提高了 14.44%,表明了在数据量和成本等方面的优势。