Jun, 2023

众包标注中的手写文本识别

TL;DR本文研究了多种训练模型的方式来识别手写文本,特别是在存在多个不完整或有噪声的转录版本时,考虑了不同的训练配置和数据选择方法,并在法国贝尔福市的城市登记册上进行了实验,结果表明,计算共识转录或基于多个转录进行训练是有希望的替代方案,但基于注释者之间的一致程度选择训练样本会引入偏差并不能提高结果。