May, 2024

铁路技术图 (RTM) 组件识别的迁移学习方法

TL;DR使用深度学习和光学字符识别技术,本研究提出了一种通用系统,可以从给定的输入图像中数字化相关的地图组件数据,并创建一个格式化的文本文件。使用 Faster-RCNN 目标检测模型可以获得最高的平均精度和最高的 F1 分数值,分别为 0.68 和 0.76。通过实验结果证明,在将包含文本的图像发送到复杂的预处理流水线中去除畸变时,可以通过 OCR 来改进结果。