Jun, 2024

C-LLM: 逐字学习检测中文拼写错误

TL;DR我们提出了一种基于大型语言模型的中文拼写检查方法 C-LLM,该方法通过逐个字符检查错误,实现了字符级别的对齐,从而有效地缓解了与字符级别约束相关的问题。在两个中文拼写检查基准测试中的实验表明,C-LLM 相比现有方法平均提升了 10%,在一般场景下提升了 2.1%,在垂直领域场景中有显著的 12%改进,达到了最先进的性能。