Jul, 2023

计数、解码和提取:一种新的手写中文字符纠错方法

TL;DR最近,采用编码器-解码器方法将汉字分解为表意描述序列(IDS)的手写汉字纠错得到显著改进。然而,现有方法隐含地捕捉和编码IDS序列中固有的语言信息,导致生成与已见字符匹配的IDS序列的倾向。鉴于此,我们引入了Count,Decode和Fetch(CDF),一种新颖的方法,对于未见过的错误拼写字符具有更好的泛化性。通过集成到现有的编码器-解码器模型中,我们显著提高了其性能。