Mar, 2024

HierCode:一种用于零样本中文文本识别的轻量级分层编码本

TL;DRHierCode 是一种利用汉字的内在层次结构,通过多热编码策略和原型学习创建独特、信息丰富的表示来解决汉字识别中的挑战,包括层次化部首表示、未知字符识别以及线级识别任务,并在各个基准测试中展示其优越性能。