Jun, 2024

TAGLAS: 在大规模图和语言模型时代的文本属性图数据集图集

TL;DRTAGLAS 是一个包含文字属性图数据集和基准测试的图谱,其中包括超过 23 个 TAG 数据集,涵盖引文图到分子图的不同领域和节点分类到图问题回答的不同任务。TAGLAS 的数据集具有统一的节点和边缘文字特征格式,允许在不同领域的多个数据集上同时训练和评估图模型。此项目还提供了标准化、高效和简化的数据集和任务加载方式,以及有用的工具,如文字到嵌入式转换和图到文字转换,以促进不同的评估场景。该项目目前还在建设中,未来将提供更多数据集和特性。