Jun, 2024

DocGenome:用于训练和测试多模态大型语言模型的开放式大规模科学文档基准

TL;DR通过提取自科学文档中的多模态数据,并评估大型模型处理科学文档任务的能力,对科学文档记录的研究发现和有价值的人类知识进行综合性的数据分析是有意义的。我们介绍了 DocGenome,这是一个结构化文档基准,通过我们的自定义自动标注流水线对 arXiv 开放访问社区中的 153 个学科的 50 万份科学文档进行注释,它具有完整性、逻辑性、多样性和正确性等四个关键特征。我们进行广泛的实验证明了 DocGenome 的优势,并客观评估了大型模型在我们的基准上的性能。