基于 Transformer 的多形状检测器 ChartDETR 通过在正则形状的角点定位关键点来重建单个图表图像中的多个数据元素,从而在一次预测中预测所有数据元素的形状,不需要进一步的后处理,有效地检测不同形状的数据元素,并在多个数据集上实现了具有竞争力的结果。
Aug, 2023
本文介绍了一种基于深度神经网络的自动数据提取框架,用于解决处理不同类型图表时的对象关系,文本识别和对象匹配问题,并成功处理 79.4% 的模拟条形图和 88.0% 的模拟饼图,但对于训练域外的图表性能下降 57.5% 和 62.3%。
Jun, 2019
提出了一种基于 Hierarchical Context Embedding(HCE)框架的对象检测方法,该方法通过挖掘上下文线索来增强区域感知检测器的分类能力。HCE 包含一个图像级别分类嵌入模块和一个区域感知分类嵌入模块,两个模块分别从整体和局部两个方面提取特征,并通过两种策略实现早期特征合并和分类器信任度合并,以提高区域感知检测器的检测性能。
Aug, 2020
通过使用点建议网络,我们提出了一种可扩展的方法来识别语义点,以便从科学文章中反向工程(提取值),特别是数据图表。我们的模型能够准确检测复杂的条形图中的显著点,并且在合成的图表上也表现出很好的性能。
本文提出了两种方法:使用多任务学习模型获取上下文数据以在自动艺术分析中使用上下文,以及通过艺术特定的知识图谱获得上下文,为视觉表示增加上下文艺术信息,以实现艺术作品的分类和检索。
Apr, 2019
本文使用深度卷积神经网络、图形模型和关注点概念相结合的方法,设计了一种用于数字文本中表格和图表检测和定位的深度神经网络,其结果在 ICDAR 2013 数据集中表现良好。
Apr, 2018
本文提出了一种综合局部外观特征,对象关系的上下文信息和全局场景上下文特征的集合物体检测系统,该系统采用基于对象建议的完全连接条件随机场(CRF)进行建模,并利用快速平均场近似方法有效地进行 CRF 模型中的推理,实验结果表明,与基线算法 Faster R-CNN 相比,我们的方法在 PASCAL VOC 2007 数据集上实现了更高的平均精度(mAP).
Apr, 2016
该研究利用上下文感知来提高机器学习模型的语义理解和上下文意识,提出了将依赖上下文的异常检测问题转化为链路预测问题的框架,并通过知识图谱嵌入模型实现系统,展示了该方法能够高度准确地检测出依赖上下文的异常。
Mar, 2022
通过将语境知识编码到知识图中,提高深度学习方法的鲁棒性,增强物体识别模型对于跨领域和真实世界场景的表现。
Oct, 2022
ChartSpark 是一个新型系统,它基于文本到图像生成模型将语义内容嵌入图表中,以此生成有关文本输入和嵌入式数据信息的图片可视化图表,并设计了一个交互式可视化界面,它包括文本分析器、编辑模块和评估模块,用户可以使用该界面生成、修改和评估图片可视化图表。
Apr, 2023