本文提出了一种新的文本图像增强方法,使用自定义的参考点来生成更适合训练识别网络的样本,并通过联合学习框架优化训练过程,实验证明该方法显著提高了识别网络的性能。
Mar, 2020
本文提出了 HandAugment,一种方法来合成图像数据以增强神经网络的训练过程,在 HANDS 2019 挑战赛中,该方法取得了深度为基础的 3D 手部姿势估计任务的第一名。
Jan, 2020
本文介绍了一种技术,通过加入实际的随机噪声到参数实例化中,从现有样本生成新的训练样本数据,以实现针对缺少大量标记数据的本地语言的字符识别,同时可用于物体识别等相关上下文。
Apr, 2019
本研究使用开源字体和数据增广技术生成 900 万份手写词图像,可用于训练深度神经网络并提高手写词识别的性能。
Aug, 2016
本文提出一种无监督的写手适应方法,使用合成字体完全训练出的识别器自动适应新的入职写手,从而提供了一种实用且通用的方法来处理新的文档收集,而不需要任何昂贵和繁琐的手动注释步骤。
Sep, 2019
该研究通过提出一种基于书法风格特征和文本内容来调节生成过程的方法,使生成的手写单词图像更真实和多样化。该模型不受预定义词汇的限制,能够渲染任何输入的单词,并且在少量样本的情况下能够模仿样本写手的书法特征。研究通过定性、定量和基于人的评估显著超越了以往的研究。
使用 SmartPatch 来增加对当前最先进方法的性能,提高生成手写字的真实性和质量,SmartPatch 将平行训练的手写文本识别系统和单词的单独字符所收集的信息与众所周知的贴片损失相结合,以减少笔级别的伪像。
May, 2021
本文研究数据增强在图像分类中的应用,对比了多种增强技术,包括传统的裁剪、旋转和翻转以及使用 GAN 生成不同风格的图像,并提出了一种名为神经增强的方法,通过训练神经网络自学习增强,以提升分类器性能,对该方法在不同数据集上表现的优劣进行了讨论。
Dec, 2017
使用改进的 DCGAN 架构和强化学习技术,本文提出一种智能系统,旨在学习实体的手写字体,可以用于鉴别伪造文件、签名验证、计算机生成艺术和文件数字化等领域。初步实现结果表明,该算法在 MNIST 数据集上表现优异。
Nov, 2016
本研究探索了一种名为 GenAug 的文本生成数据增强方法,利用包括外部知识在内的各种增强方法在 Yelp 评论的子集上进行 GPT-2 微调,并研究了增强数量与生成文本质量之间的关系,实验表明插入字符级合成噪声和使用上位词进行关键词替换是有效的增强方法,生成质量在原始数据量的三倍左右达到峰值。
Oct, 2020