EMNLPOct, 2022

只有 400 个样本!重新审视自动生成拼音规则对菲律宾语拼写规范化的有效性

TL;DR本研究提出了一种基于 N-Gram 与 Damerau Levenshtein 距离模型的自动规则抽取方法,这种模型利用少量的数据进行训练,实现了良好的性能,并且在没有足够数据时,传统的方法胜过复杂的深度学习模型。