神经光学字符识别历史文献后处理校正

ACLFeb, 2021

Neural OCR Post-Hoc Correction of Historical Corpora

Lijun Lyu, Maria Koutraki, Martin Krickl, Besnik Fetahu

TL;DR本研究提出了一种基于循环神经网络和卷积神经网络的光学字符识别错误自动纠正方法，针对历史藏书文献的 OCR 后置处理，以很高的效率在德语历史图书文献语料库中降低了字符误差率 32.3％以上。

Abstract

optical character recognition (ocr) is crucial for a deeper access to historical collections. ocr needs to account for orthographic variat

发现论文，激发创造

本文提出了一种基于用户纠错信息的 object segmentation 方法，使用卷积神经网络进行模型训练，并实现了在测试时动态更新模型参数以适应数据的特点，从而在 8 个不同数据集上得到了较为优异的实验结果。

Nov, 2019

本研究提出了使用卷积神经网络和图神经网络相结合的新型架构，基于自我监督学习的方法，无需基准来自动识别三维器官风险分割中的错误，为放射治疗过程提供了离线质量保证工具，以便识别需要专注于的区域。

Jun, 2022

利用多尺度三维卷积网络实现三维重建和图像分割中的异常检测和校正任务，输入原始图像和候选对象的二进制掩模，可以获得分裂和合并错误地图以及真实对象，使用错误检测网络得到的错误建议对象掩模可以提高错误校正网络的准确性。

Aug, 2017

本文提出了一种称为 DeepCorrect 的方法，通过对权值进行微调，修正深度神经网络中感受野受损图像变形的问题，该方法显著提高了网络的鲁棒性和性能。

May, 2017

本文提出了一种基于自监督生成学习的、注释高效的 OCT 图像细分方法，该方法可以显著降低注释成本并加速训练，相比于 U-Net 模型，只需要约 10% 的数据就能达到相同的分割精度。

May, 2023

研究论文提出了一种通过对比学习来检测图像中大尺寸污损区域的方法，并且克服了不同污损模式的挑战，实现了图像修复的优越性能和泛化能力。

Aug, 2023

提出了一个深度学习神经网络的标签检查和修正方法，该方法结合了小损失选择和噪声校正的思想，采用两个不同的网络来通过小损失选择方法训练，并根据两网络的分类误差和同意误差的评估来度量训练数据的置信度，在真实和人工数据集上测试表明该方法优于基准方法。

Feb, 2022

本文提出了一种名为 “focused proofreading” 的新策略，结合自动图像分割和生物信息，成功减少了手动修正（proofreading）的时间和地点，应用于大型数据集中的果蝇视神经中，使跟踪速度提高了 3-5 倍。

Sep, 2014

我们提出了一种基于图神经网络的转换器方法来识别和测量分割图中的错误区域，并通过遥测得出高层结构内的人类耳蜗错误率为 0.042，大约 79.53% 的准确性。

Aug, 2023

本文提出一种基于反馈机制的面向难度级别泛化的深度卷积神经网络图像修复模型自动生成的算法，旨在避免 “固定” 模型对于固定难度级别的训练。实验表明，在四个图像修复任务上，本算法均优于传统训练和课程学习替代方案。

Dec, 2016