Aug, 2023

RSpell:领域自适应中文拼写检查的检索增强框架

TL;DR我们提出了一种称为 RSpell 的检索增强的拼写检查框架,通过搜索相应的领域术语并将其合并到拼写检查模型中,来增强其错误纠正能力。通过结合拼音模糊匹配和输入,我们引入了一种自适应过程控制机制来动态调整外部知识对模型的影响,同时采用迭代策略加强了 RSpell 框架的推理能力。通过在法律、医学和官方文件撰写三个领域的 CSC 数据集上进行实验,结果表明 RSpell 在零样本和微调场景下均取得了最先进的性能,验证了检索增强的拼写检查框架的有效性。我们的代码可在 https URL 获取。