学习如何结合语法纠错

Jun, 2019

Learning to combine Grammatical Error Corrections

Yoav Kantor, Yoav Katz, Leshem Choshen, Edo Cohen-Karlik, Naftali Liberman...

TL;DR本研究提出了自动检测系统强度或多个系统组合的方法，在所有测试配置中一致优于最佳独立系统，并对 BERT 的应用进行了分析，同时呈现了对本任务创建的拼写检查器的实验结果。

Abstract

The field of grammatical error correction (GEC) has produced various systems to deal with focused phenomena or general text editing. We propose an automatic way to combine black-box systems. Our method automatically detects the strength of a system or the →

grammatical error correction black-box system combination bert spellchecker

发现论文，激发创造

语法错误修正的综合性调查

GEC has seen significant progress thanks to machine learning and deep learning techniques, particularly in NMT based approaches, and this is the first survey to comprehensively cover literature in this area, examining datasets, annotation schemas, shared tasks, evaluation metrics, four basic approaches, six performance boosting techniques, two data augmentation methods, and future research directions.

May, 2020

通过质量估计进行语法错误校正的系统组合

我们提出 GRECO，一种新的最先进的质量估计模型，用于评估纠正后句子的质量，得到与 F0.5 分数更高的更好估计，从而实现更高的 F0.5 分数的综合 GEC 系统。我们还提出了三种利用 GEC 质量估计模型进行系统组合的方法，包括模型无关方法、带有投票偏差的模型无关方法和模型相关方法。综合 GEC 系统在 CoNLL-2014 测试集和 BEA-2019 测试集上表现超过现有最新水平，达到迄今最高的 F0.5 分数。

Oct, 2023

评估优秀的语法错误修正

对瑞典学生文本进行全面评估，发现在少样本环境下，GPT-3 明显优于之前瑞典语语法错误修正系统，同时发现当前评估方法存在不可取的偏见，建议采用人工编辑 GEC 系统的输出来分析达到本地人级别性能所需要的改变量，并提供一份包含人工编辑和语法性、流畅性和意义保持评估的数据集。

Aug, 2023

语法错误纠正：现有技术综述

在此综述文章中，我们介绍了在自然语言处理领域中的语法错误纠正任务，其中包括越来越流行的神经机器翻译系统，同时概述了任务中的语言学挑战以及常用的数据集和评价方法。我们还介绍了人类主观判断相关的可靠度指标，并总结了近年来的发展以及未来工作和仍面临的挑战，希望本综述能为新手或关注近期发展的研究人员提供全面的资源。

Nov, 2022

一个基于 BERT 的无监督语法错误纠正框架

本文提出了一种基于 BERT 的无监督语法错误校正框架，该框架将语法错误校正视为多类别分类任务，涵盖数据流构建模块、句子困境评分模块和误差检测和校正模块，并提出了一种新的伪困境评分方法来评估句子的可信度，并构建了 Tagalog 语料库进行研究，其表现竞争性较强，证明了该框架对于低资源语法错误校正任务很有用处。

Mar, 2023

大语言模型时代语法错误修正的支柱：针对现代方法的全面考察

本文通过实验研究语法错误修正，深入研究单模型系统的细微差别，比较集成和排名方法的效率，并探讨了大型语言模型在作为单模型系统、集成部分和排名方法时在语法错误修正上的应用。我们在 CoNLL-2014-test 和 BEA-test 上分别取得了 F_0.5 分数为 72.8 和 81.4 的最新最佳性能，为 GEC 的进一步发展和我们研究的可重复性提供支持。同时我们公开了我们的代码、训练模型和系统的输出结果，以便进一步推动 GEC 的发展。

Apr, 2024

一种用于语法错误校正的嵌套注意力神经混合模型

通过基于嵌套注意力层的混合神经模型，将神经机器翻译方法发展应用于语法纠错，实验证明该模型对单词或字符水平上的错误检测和修复均具有良好的效果，并在 CoNLL-14 基准测试数据集上明显优于以往的神经模型，尤其对小修改的局部错误有明显的改善。

Jul, 2017

利用 N-Best 假设改进 SMT 法进行语法纠错

本文提出了一种利用 SMT 方法生成的 n 种翻译假设来提高 GEC 准确率的新方法，即利用分类器评分来选择适当的编辑或对 n 种翻译假设进行重新排序，并将这些方法应用于使用 SMT 方法的最新 GEC 系统中，实验结果表明，我们的方法在 GEC 基准测试数据集上的准确性比已发表的最佳结果有显着提高。

Jun, 2016

混合机器翻译在语法错误修正中接近人类水平的表现

本文将基于统计机器翻译和神经机器翻译的自动语法纠错方法相结合，形成一种新的系统，这个混合系统在 CoNLL-2014 和 JFLEG 基准测试上取得了最新的最佳结果。我们的分析显示，所创建的系统比迄今为止报告的任何其他 GEC 系统更接近达到人类水平的性能。

Apr, 2018

通过混合细粒度加权训练进行语法错误修正

本研究提出了 MainGEC 方法，通过利用数据标注的准确性和潜在注释的多样性的内在差异设计了基于令牌级和句子级训练权重，并进行了混合粒度加权训练以改善 GEC 的训练效果。经验证实，MainGEC 在两个基准数据集上以 Seq2Seq 或 Seq2Edit 方式表现出一致且显著的性能提升，证明了混合粒度加权训练的有效性和优越性。进一步的消融实验验证了 MainGEC 中设计的两个粒度权重的有效性。

Nov, 2023