ICMLJun, 2023
合成孤独:探索用于语法纠错的合成数据的负面影响
Synthetic Alone: Exploring the Dark Side of Synthetic Data for Grammatical Error Correction
Chanjun Park, Seonmin Koo, Seolhwa Lee, Jaehyung Seo, Sugyeong Eo...
TL;DR本文研究数据质量控制(噪声注入和平衡数据)对基于真实数据和合成数据训练的语法纠错模型的影响,并比较了两种方法的效果,结果表明,与真实数据情况相同,数据质量控制方法对真实数据训练的模型有积极影响,而对合成数据训练的模型影响为负。