ACLMay, 2023

重新思考用于中文拼写纠正的遮盖语言建模

TL;DR通过发现 BERT 对中文拼写纠正的影响,本文提出随机蒙掉输入序列 20%的非错误标记是一种简单有效的提高语言模型和错误模型的技术,它可以被应用于任何模型架构,并在 SIGHAN 等基准测试中取得了新的最优结果