Sep, 2024

PMLBmini:用于数据稀缺应用的表格分类基准套件

TL;DR本研究针对当前表格基准测试未考虑数据稀缺应用的问题,提出了PMLBmini,一个包含44个样本量≤500的二分类数据集的表格基准套件。研究分析显示,现有的自动化机器学习和深度学习方法在低数据环境中往往难以超越简单的逻辑回归基线,但也识别了在特定场景中合理应用这些方法的可能性。