该研究提出了利用深度学习框架分类科学图表的流程,通过构建一个包含注释的大规模科学图表库,开创了科学图表自动注释的先河。
Jan, 2023
本文介绍了一种基于卷积神经网络的数据驱动方法,以训练这种分离器的端到端方式分离复合图,消除了手动设计特征和分离规则的需要,但需要大量注释的训练数据。作者在 ImageCLEF 医学数据集上评估了该技术,在 85.9% 的准确率上表现出色,并作为易于使用的 Python 库发布,旨在促进科学图形挖掘的进一步研究。
Mar, 2017
本综述论文系统地将图形分类为五类,包括表格、照片、图表、地图和绘图,并对解决图形分类问题的现有方法和数据集进行了批判性评论。最后,找出了当前研究的差距,并提供了进一步研究图形分类的可能方向。
Jul, 2023
本文提出一种端到端的神经框架,用于自动生成科学图表的信息丰富,高质量的标题,并引入了基于计算机科学 arXiv 论文的 SCICAP 大规模图标题数据集,包括 200 万多个来自 290,000 多篇论文的图像,展示了为科学图表生成标题的机遇和挑战。
Oct, 2021
本文提出了一种新的科学图表标题生成方法,通过自然语言处理、机器学习和多模态技术,从图表中提取关键信息并生成准确简洁的标题,以提高研究数据的清晰度和可访问性。
Jun, 2024
通过扩充 SciCap 数据集,创新性地将科技论文中的图例标注生成作为知识增强图像标注任务,提高自动标注的效率与准确性,并探讨了从不同模视觉图像和文本知识融合的角度进行标注生成的实验研究。
Jun, 2023
本文介绍用纯文本方法生成科学文献图注的一种新方法,使用了提取目标图像引用的句子然后将其总结为简明的图注的技术。通过真实世界 arXiv 论文的实验,我们的方法在自动和人工评估中都优于以前的方法,证明了纯文本技术在生成学术文章中的图片标注方面的有效性。
Feb, 2023
这篇文章提出了一种通过将文档视为图像从 PDF 文档中提取元数据的方法,并使用 COCO 数据集进行训练和 PubLayNet 数据集进行微调,以从德语科学出版物中提取 9 个模式(如作者、标题等),并且使用德语和英语内容和一组具有挑战性的模板生成我们提出的合成数据集。结果表明,该方法可以在准确提取具有挑战性模板的多种 PDF 文档时实现大约 90%的平均准确度。
Jun, 2021
本研究针对视觉识别技术中的特征表示、学习算法和标记的训练数据进行了探究,提出了一种基于网络监督的自动图像数据生成方法,以实现对大量视觉概念的高效训练和识别。在 Pascal VOC 2007 数据集上对该方法进行了测试,并取得了明显的优越性能。
Jun, 2019
本文介绍了一种基于深度神经网络的自动数据提取框架,用于解决处理不同类型图表时的对象关系,文本识别和对象匹配问题,并成功处理 79.4% 的模拟条形图和 88.0% 的模拟饼图,但对于训练域外的图表性能下降 57.5% 和 62.3%。