通过单个深度神经网络从图表中提取数据
通过使用点建议网络,我们提出了一种可扩展的方法来识别语义点,以便从科学文章中反向工程(提取值),特别是数据图表。我们的模型能够准确检测复杂的条形图中的显著点,并且在合成的图表上也表现出很好的性能。
Aug, 2023
本文使用深度卷积神经网络、图形模型和关注点概念相结合的方法,设计了一种用于数字文本中表格和图表检测和定位的深度神经网络,其结果在 ICDAR 2013 数据集中表现良好。
Apr, 2018
该研究介绍了一种完全自动化的系统,利用深度学习技术识别散点图中的关键组成部分,并利用光学字符识别和鲁棒回归从图像中提取散点数值,该方法可以成功从 89% 的测试数据中提取数据。
Apr, 2017
基于 Transformer 的多形状检测器 ChartDETR 通过在正则形状的角点定位关键点来重建单个图表图像中的多个数据元素,从而在一次预测中预测所有数据元素的形状,不需要进一步的后处理,有效地检测不同形状的数据元素,并在多个数据集上实现了具有竞争力的结果。
Aug, 2023
本文提出了一种基于实例分割的数据线提取方法(LineFormer),在多个基准数据集上取得了最优性能,是提高自动文档理解中数据抽取的关键技术之一。
May, 2023
本论文提出了一种基于神经网络的模型来自动生成数据可视化的自然语言摘要,使得即使视力受损的用户也能够获取数据可视化的重要见解。
Oct, 2020
本研究的 Chart-to-text 数据集为基础,使用图像字幕和数据转换技术探索了从图表到文本的自然语言概括方法以及相应的神经网络模型,研究结果表明此方法对复杂模式和趋势的描述存在困难。
Mar, 2022
本文介绍了一种利用深度学习、OCR 和图像处理技术的自动化流程 ChartParser,可以将研究论文中的图表提取出来,进行分类,提取有用信息,并以易于使用的表格格式呈现给盲人、低视力和其他印刷受限 (BLV) 的人群。我们还对该方法进行了详细的评估。
Nov, 2022
调查了当前用于图表分类的最新技术,并对最近发布的 CHARTINFO UB-UNITECH PMC 数据集进行了广泛的性能比较分析,实现了一种基于视觉的 Transformer 模型,取得了在图表分类方面顶尖的结果。
Jul, 2023