ACL-Fig: 用于科学图像分类的数据集
本综述论文系统地将图形分类为五类,包括表格、照片、图表、地图和绘图,并对解决图形分类问题的现有方法和数据集进行了批判性评论。最后,找出了当前研究的差距,并提供了进一步研究图形分类的可能方向。
Jul, 2023
通过扩充 SciCap 数据集,创新性地将科技论文中的图例标注生成作为知识增强图像标注任务,提高自动标注的效率与准确性,并探讨了从不同模视觉图像和文本知识融合的角度进行标注生成的实验研究。
Jun, 2023
FigureQA 是一个视觉推理语料库,包含超过一百万个基于 100,000 张图像的问题 - 答案对。图像来自五个类别的合成科学式图形:线图、点线图、垂直和水平条形图以及饼状图。通过从 15 个模板中生成问题并提供用于训练机器学习模型的附属数据,FigureQA 为开发可以直观地识别数据可视化中的模式的模型迈出了第一步。
Oct, 2017
本文提出一种端到端的神经框架,用于自动生成科学图表的信息丰富,高质量的标题,并引入了基于计算机科学 arXiv 论文的 SCICAP 大规模图标题数据集,包括 200 万多个来自 290,000 多篇论文的图像,展示了为科学图表生成标题的机遇和挑战。
Oct, 2021
介绍了用于 MedICaT 医学图像的上下文数据集,其中包括来自 131k 篇开放获取生物医学论文的 217k 个图像。该数据集用于研究复合图中的子图对子标题的自动对齐,并展示了内联引用在图像文本匹配中的效用。
Oct, 2020
提供了一个由领域专家精心制作和评估的新型摘要数据集 ACLSum,集成了多个方面的科学论文摘要,通过对预训练语言模型和最先进的大型语言模型(LLMs)的性能进行广泛实验,探索学术领域中抽取式与生成式摘要的有效性,结果证实了在学术领域中端到端基于方面的摘要的普遍优越性。
Mar, 2024
介绍了 Qatent PatFig,这是一个创新的大规模专利图像数据集,包括来自超过 11,000 个欧洲专利申请的 30,000 多个专利图像。每个图像都提供简短和长篇的描述、参考编号及其相应的术语,以及描述图像组件之间相互作用的最小索赔集。通过在 Qatent PatFig 上微调 LVLM 模型以生成简短和长篇描述,并研究在专利图像字幕生成过程中加入不同的基于文本的线索在预测阶段的效果,评估了数据集的可用性。
Sep, 2023
ACL OCL 是一个学术语料库,包含了 74k 篇计算语言学领域的科学论文,210k 个提取的图形,以及针对所有 OCL 论文的主题。该研究观察到语法标注、分块和解析主题明显下降,而自然语言生成主题再次兴盛。
May, 2023
提出了一个名为 AIC 的大规模数据集,其中包括人类关键点检测、大规模属性数据集和图像中文字幕,用于评估和改进计算方法。
Nov, 2017