深度片段网络鉴别手写者身份

Mar, 2020

FragNet: Writer Identification using Deep Fragment Networks

Sheng He, Lambert Schomaker

TL;DR本文提出了一个基于单词或文本块图像的笔迹识别的新基准研究，旨在提取有效特征。通过使用 FragNet 这个深层神经网络来解决这个问题，得到了准确的结果。实验表明，该方法可以基于单词和页面图像进行高效和稳健的笔迹识别。

Abstract

writer identification based on a small amount of text is a challenging problem. In this paper, we propose a new benchmark study for writer identification based on word or text block images which approximately con

writer identification word images deep neural network fragnet benchmark study

发现论文，激发创造

纸质文献片段的笔迹检索与鉴定特征混合

本文提出一种基于深度学习的新方法来识别和检索古希腊纸质文献上的作者的笔迹，并结合新颖的神经网络架构和性能评估方法来提高特定作家和相同图像的片段检索效果。

Jun, 2023

基于注意力机制的离线书写者识别端到端网络 (基于字级数据)

本文提出了一种基于注意力驱动的卷积神经网络的作者识别系统，该系统利用从词图像中提取的图像片段进行训练，采用金字塔策略。该系统能够全面捕捉数据的细节和粗糙特征，以及不同抽象层次上的信息。此外，文中探讨了使用注意力机制来增强学习特征的表征能力。该算法在三个基准数据库上进行了评估，证明了其在作者识别任务中的有效性，尤其是在有限手写数据的情景中。

Apr, 2024

DeepWriterID：一种端到端的在线无文本依赖的笔迹识别系统

该研究引入了一个名为 DeepWriterID 的系统，该系统利用深度卷积神经网络进行笔迹、手写体识别，并引入了一种名为 DropSegment 的新方法来实现数据增强和改善 CNN 的泛化适用性。通过在笔放置状态下只使用笔位信息，该系统在 NLPR 手写数据库中实现了 95.72％的中文文本识别率和 98.51％的英文文本识别率，创造了新的最高记录。

Aug, 2015

基于单个手写单词图像的深度自适应写手识别学习

该论文提出了一种基于多任务深度自适应学习的方法，利用深度卷积神经网络从显式内容识别的辅助任务中学习通用的特征，从而提高单词图像的写作者识别性能。

Sep, 2018

全球正则网络用于笔迹识别

提出了一种全局正则网络（GRN），其由一个带有全局特征提取器的分支和一个带有局部特征提取器的分支组成，两者以一种全局残差方式融合，可以有效地识别手写字的写作人，实验表明该模型在 CVL 数据集上取得了卓越的 99.98％-1 准确率和 100％ top-5 准确率，具有更短的训练时间和更少的网络参数。

Jan, 2022

使用卷积神经网络激活特征的离线作者识别

通过使用卷积神经网络的激活特征作为本地描述符，结合高斯混合模型超向量编码和 KL-Kernel 归一化，我们提出了一种用于笔迹识别的全局描述符方法，在 ICDAR 2013 基准数据库和 CVL 数据集上进行了评估，在挑战性的双语 ICDAR 数据集上改进了 0.21 个 mAP 的绝对值。

Feb, 2024

MixNet: 在野外准确检测具挑战性场景文本的研究

MixNet 是一种综合 CNN 和 Transformer 优势的混合架构，能够准确地检测小文本，不受方向、风格和光照条件的影响。MixNet 通过 Feature Shuffle Network（FSNet）和 Central Transformer Block（CTBlock）两个关键模块实现，其中 FSNet 通过特征重排策略生成高分辨率特征，优于 ResNet 和 HRNet；CTBlock 基于中心线特征，在小文本紧密出现时优于基于轮廓的方法。大量实验证明，MixNet 在多个场景文本检测数据集上实现了最先进的结果。

Aug, 2023

使用多头循环神经网络进行作者识别

通过把一个字符级 RNN 语言模型的输出层划分成几个独立的预测子模型，每个子模型代表一个作者，而循环层被所有子模型共享，本文提出了一种新的方法，该方法允许循环层模拟整个语言而不会产生过拟合，同时输出选择反映其作者风格的潜在模型方面，该方法在四种语言中两次排名第一，证明了它的有效性。

Jun, 2015

深度片段嵌入用于双向图像句子映射

该研究提出了一种通过多模态的可视图像和自然语言数据的嵌入来实现图像和句子的双向检索的模型，通过对图像和句子的片段进行嵌入到一个共同的空间，实现了片段对齐，从而在图像句子检索任务中显著提高了性能，并提供了可解释的预测结果。

Jun, 2014

多语言自然场景文本检测算法研究

我们提出了一种多语言文本检测模型，通过引入 SFM Swin Transformer 特征提取网络、AS-HRFPN 特征融合网络和全局语义分割分支，改进了对自然场景中多语言文本的检测准确性和难度，实验结果表明该算法 F-measure 值为 85.02%，比基准模型高出 4.71%。

Dec, 2023