VATr++:为手写文本生成明智选择您的字词
我们提出了一种新型的基于 Transformer 的手写文本样式图像生成方法,旨在学习样式 - 内容的缠结以及全局和局部写作风格模式。通过自注意机制,所提出的 HWT 捕捉了样式示例中的长距离和短距离关系,从而编码了全局和局部样式模式。此外,所提出的基于 Transformer 的 HWT 包括编码器 - 解码器注意力,通过聚集每个查询字符的样式表示来实现样式 - 内容缠结。
Apr, 2021
通过深度学习模型,我们提出了一种适用于装饰手写文本生成(Styled HTG)评估的手写距离(HWD)方法,它能够从可变长度的输入图像中提取手写风格特征,并利用感知距离来比较手写的微妙几何特征,经过大量实验对手写文本图像的不同数据集进行评估,表明我们提出的 HWD 方法适用于 Styled HTG 的评分,对于评估 HTG 模型提供了有价值的工具,从而推动了这一重要研究领域的发展。
Oct, 2023
本文提出一种无监督的写手适应方法,使用合成字体完全训练出的识别器自动适应新的入职写手,从而提供了一种实用且通用的方法来处理新的文档收集,而不需要任何昂贵和繁琐的手动注释步骤。
Sep, 2019
本研究提出了一种基于 Transformer 模型生成手写文本,并将文本表示为密集向量序列的方法,其可用于生成含有少量样本的手写文本,使得即使在训练期间很少看到的字符也能够从它们的视觉原型中生成。
Mar, 2023
这篇论文介绍了在应用阶段中评估手写文本识别 (HTR) 模型所面临的问题,以及介绍了使用不依赖于地面真实文本数据的指标来选择最佳模型的方法,其中包括使用标准语言模型和遮盖语言模型 (MLM) 的复杂度更高的方法,并表明 MLM 评估可以与基于词典的方法相竞争,其优点在于大型和多语言 Transformer 是随时可以使用的。
Jan, 2022
本文提出了一种新颖的元学习框架,该框架可以在推理过程中通过支持集合利用额外的新作者数据并通过单个梯度步更新输出作者自适应模型,这个模型可以在最先进的 HTR 模型之上轻松实现,并且可以在极少的新风格数据下实现平均 5-7% 的性能提升。
Apr, 2021
该研究通过提出一种基于书法风格特征和文本内容来调节生成过程的方法,使生成的手写单词图像更真实和多样化。该模型不受预定义词汇的限制,能够渲染任何输入的单词,并且在少量样本的情况下能够模仿样本写手的书法特征。研究通过定性、定量和基于人的评估显著超越了以往的研究。
Mar, 2020
通过对大型基准数据集和通过手写文本生成模型产生的合成数据集的研究,本文提出在大数据集上预训练手写文本识别模型,并在少量带有个人特点手写的小规模数据集上进行微调,以有效转录手稿。
May, 2023
介绍一种基于半监督学习的手写文本图像合成方法,该方法可生成任意长度的词汇风格多样的手写文本图像,并实现其风格的操纵,能够提高光学字符识别系统的性能。
Mar, 2020
使用 SmartPatch 来增加对当前最先进方法的性能,提高生成手写字的真实性和质量,SmartPatch 将平行训练的手写文本识别系统和单词的单独字符所收集的信息与众所周知的贴片损失相结合,以减少笔级别的伪像。
May, 2021