Dec, 2023

使用 TableShift 评估表格数据中的分布偏移

TL;DRTabularShift 是一个用于表格数据的分布转移基准,包含 15 个二分类任务,涵盖金融、教育、公共政策、医疗保健和市民参与等领域,并通过 TableShift API 可轻松访问。在该基准上,我们对多个最先进的表格数据模型进行了大规模研究,并与健壮学习和领域泛化方法进行了比较,结果显示(1)ID 和 OOD 准确性之间存在线性趋势;(2)领域健壮性方法可以缩小转移差距,但会降低 ID 准确性;(3)标签分布转移与转移差距之间存在密切关系。