ACLMay, 2023

形态变化中的噪声研究

TL;DR本文旨在探讨稀缺高质量数据的语言中的形态学屈折系统,包括对非监督形态学范式完成的管道内遇到的噪声类型进行了错误分类和注释流程、比较不同类型噪声对现有最新型变型模型的影响、再提出使用字符级屏蔽语言建模(CMLM)预训练目标探索其对模型的抗噪性的影响。实验发现,各种建筑物受到不同类型的噪声的影响不同,但编码器解码器比具有复制偏差的模型更为稳健。CMLM 预训练有助于变压器,但对 LSTM 影响较小。