Oct, 2023

在线手写文本分类的自监督表示学习

TL;DR通过自我监督学习从未标注的数据中提取丰富的表示,避免了对大规模数据集的标注成本。本研究针对在线手写文本的不断发展应用,提出了一种新颖的基于笔画部分遮罩的预训练任务 (POSM),用于从英语和汉语两种语言的个人在线手写中提取信息丰富的表示,以及两种建议的微调预训练模型的流程。为了评估提取表示的质量,我们使用内在和外在评估方法。微调预训练模型可实现诸如作者识别、性别分类和利手性分类等任务的最新成果,并凸显了利用预训练模型优于从头开始训练模型的优点。