Nov, 2022

汉语多音字消歧的回译式数据增强

TL;DR本文提出了一种基于回译的数据增强方法,采用大量未标注的文本数据来解决中文多音字消歧问题,并设计了一种数据平衡策略来提高训练集中某些典型的多音字字符的识别准确性。