新颖性手写识别
本文提出一种无监督的写手适应方法,使用合成字体完全训练出的识别器自动适应新的入职写手,从而提供了一种实用且通用的方法来处理新的文档收集,而不需要任何昂贵和繁琐的手动注释步骤。
Sep, 2019
通过引入与文本进行比较的任务,我们提出了一个无限制的二元分类器,其中包括一个手写识别特征提取器和一个多模态分类头,该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明,与直接使用最先进的手写识别模型来解决任务相比,尽管保持高回收率,但分类器可以进行校准,使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。
Sep, 2023
本文提出了一种新颖的元学习框架,该框架可以在推理过程中通过支持集合利用额外的新作者数据并通过单个梯度步更新输出作者自适应模型,这个模型可以在最先进的 HTR 模型之上轻松实现,并且可以在极少的新风格数据下实现平均 5-7% 的性能提升。
Apr, 2021
本文介绍了一种应对开放性场景中新颖性挑战的方法,该方法结合了逻辑表示和推理方法,利用通用方法和架构机制检测、表征新颖性,并构建相应的适应性模型进行应对。通过在多智能体博弈中的评估,结果表明所提出的方法在各种新颖性挑战下均表现出高准确率。
Feb, 2023
使用改进的 DCGAN 架构和强化学习技术,本文提出一种智能系统,旨在学习实体的手写字体,可以用于鉴别伪造文件、签名验证、计算机生成艺术和文件数字化等领域。初步实现结果表明,该算法在 MNIST 数据集上表现优异。
Nov, 2016
该论文介绍了 NoveltyTask,通过评估系统在处理 novelties 方面的性能来开始一个系统性的研究,并将其应用于作者归属任务中,使用 Amazon 评论的数据集进行实验和探索基准方法,最终结果表明该任务具有相当低的性能。
May, 2023
通过对大型基准数据集和通过手写文本生成模型产生的合成数据集的研究,本文提出在大数据集上预训练手写文本识别模型,并在少量带有个人特点手写的小规模数据集上进行微调,以有效转录手稿。
May, 2023
司法笔迹鉴定是法医科学的一个分支,旨在通过全面比较内在的局部和全局特征,检验手写文件以准确定义或假设手稿的作者。该研究提出了一个新的数据集,包括传统手写文件和数字工具(如平板电脑)生成的文件之间的比较,并展示了数据的初步结果,显示第一子集可以达到 90%的分类准确率,第二子集可以达到 96%。
Jan, 2024
该研究提出了一种基于识别的新颖方法,通过使用基于变压器的文档检索和集成方法在模型层面上改进了 HW-SQuAD 和 BenthamQA 数据集上的现有最先进技术,分别实现了 82.02%和 92.55%的精确匹配得分,在 HW-SQuAD 和 BenthamQA 数据集上超过了现有最佳的基于识别的方法 10.89%和 26%。我们还增强了文档检索组件,将前五次检索的准确性从 90%提高到 95.30%。我们的研究结果证明了我们提出的方法在推进手写文档问答方面的重要性。代码和训练模型将公开提供,以促进未来在这一关键领域的研究。
Jun, 2024
我们提出了一种新型的基于 Transformer 的手写文本样式图像生成方法,旨在学习样式 - 内容的缠结以及全局和局部写作风格模式。通过自注意机制,所提出的 HWT 捕捉了样式示例中的长距离和短距离关系,从而编码了全局和局部样式模式。此外,所提出的基于 Transformer 的 HWT 包括编码器 - 解码器注意力,通过聚集每个查询字符的样式表示来实现样式 - 内容缠结。
Apr, 2021