Jul, 2024
重新考虑用于评估GNNs的基准图分类数据集的有效性
Rethinking the Effectiveness of Graph Classification Datasets in
Benchmarks for Assessing GNNs
TL;DR在图学习领域中,我们首次全面研究并明确定义了数据集有效性,通过基于公平基准测试框架的经验性协议和考虑数据集复杂性和模型性能的新指标,我们发现我们的指标与现有研究和直觉假设一致,同时通过研究内在图属性和类标签之间的相关性以及开发支持相关性可控合成数据集生成的新技术,我们揭示了某些数据集低有效性背后的原因,我们的发现为当前对基准数据集的理解提供了启示,并可推动未来图分类基准的进化。