Mar, 2024

语法与拼写错误校正:基于 BART 和 MarianMT 的 Transformer 语言模型响应性调查

TL;DR这项研究旨在分析在文本文件中出现的各种错误,并利用两种先进的深度神经网络语言模型 (BART 和 MarianMT) 纠正文本中存在的异常。通过可用的数据集进行这些模型的迁移学习,以调整其错误纠正能力。通过比较研究发现,虽然这两种模型都可以将错误句子减少 20+%,但 BART 在拼写错误 (24.6%) 方面表现得更好,而在语法错误 (8.8%) 方面表现较差。