深度片段网络鉴别手写者身份
本文提出一种基于深度学习的新方法来识别和检索古希腊纸质文献上的作者的笔迹,并结合新颖的神经网络架构和性能评估方法来提高特定作家和相同图像的片段检索效果。
Jun, 2023
本文提出了一种基于注意力驱动的卷积神经网络的作者识别系统,该系统利用从词图像中提取的图像片段进行训练,采用金字塔策略。该系统能够全面捕捉数据的细节和粗糙特征,以及不同抽象层次上的信息。此外,文中探讨了使用注意力机制来增强学习特征的表征能力。该算法在三个基准数据库上进行了评估,证明了其在作者识别任务中的有效性,尤其是在有限手写数据的情景中。
Apr, 2024
该研究引入了一个名为 DeepWriterID 的系统,该系统利用深度卷积神经网络进行笔迹、手写体识别,并引入了一种名为 DropSegment 的新方法来实现数据增强和改善 CNN 的泛化适用性。通过在笔放置状态下只使用笔位信息,该系统在 NLPR 手写数据库中实现了 95.72%的中文文本识别率和 98.51%的英文文本识别率,创造了新的最高记录。
Aug, 2015
该论文提出了一种基于多任务深度自适应学习的方法,利用深度卷积神经网络从显式内容识别的辅助任务中学习通用的特征,从而提高单词图像的写作者识别性能。
Sep, 2018
提出了一种全局正则网络(GRN),其由一个带有全局特征提取器的分支和一个带有局部特征提取器的分支组成,两者以一种全局残差方式融合,可以有效地识别手写字的写作人,实验表明该模型在 CVL 数据集上取得了卓越的 99.98%-1 准确率和 100% top-5 准确率,具有更短的训练时间和更少的网络参数。
Jan, 2022
通过使用卷积神经网络的激活特征作为本地描述符,结合高斯混合模型超向量编码和 KL-Kernel 归一化,我们提出了一种用于笔迹识别的全局描述符方法,在 ICDAR 2013 基准数据库和 CVL 数据集上进行了评估,在挑战性的双语 ICDAR 数据集上改进了 0.21 个 mAP 的绝对值。
Feb, 2024
MixNet 是一种综合 CNN 和 Transformer 优势的混合架构,能够准确地检测小文本,不受方向、风格和光照条件的影响。MixNet 通过 Feature Shuffle Network(FSNet)和 Central Transformer Block(CTBlock)两个关键模块实现,其中 FSNet 通过特征重排策略生成高分辨率特征,优于 ResNet 和 HRNet;CTBlock 基于中心线特征,在小文本紧密出现时优于基于轮廓的方法。大量实验证明,MixNet 在多个场景文本检测数据集上实现了最先进的结果。
Aug, 2023
通过把一个字符级 RNN 语言模型的输出层划分成几个独立的预测子模型,每个子模型代表一个作者,而循环层被所有子模型共享,本文提出了一种新的方法,该方法允许循环层模拟整个语言而不会产生过拟合,同时输出选择反映其作者风格的潜在模型方面,该方法在四种语言中两次排名第一,证明了它的有效性。
Jun, 2015
该研究提出了一种通过多模态的可视图像和自然语言数据的嵌入来实现图像和句子的双向检索的模型,通过对图像和句子的片段进行嵌入到一个共同的空间,实现了片段对齐,从而在图像句子检索任务中显著提高了性能,并提供了可解释的预测结果。
Jun, 2014
我们提出了一种多语言文本检测模型,通过引入 SFM Swin Transformer 特征提取网络、AS-HRFPN 特征融合网络和全局语义分割分支,改进了对自然场景中多语言文本的检测准确性和难度,实验结果表明该算法 F-measure 值为 85.02%,比基准模型高出 4.71%。
Dec, 2023