ICMLMay, 2024

关于为何应将表格基础模型作为研究优先事项

TL;DR近期的文本和图像基础模型受到了极大的关注,本文旨在将机器学习研究社区的重点稍稍转向不同的模态:表格数据。表格数据是许多领域的主要模态,但在规模和能力方面明显落后,我们认为现在是开发表格基础模型(或我们所称的大型表格模型)的时候了。大型表格模型将可能从多个角度革新科学和机器学习对表格数据的使用:不仅仅是分析单个数据集,而是联系相关数据集进行分析。潜在的影响是广泛的:从少样本表格模型到自动化数据科学;从超分布合成数据到促进多学科科学发现。我们希望激发对我们所研究模态的思考,并使一些研究人员开始研究大型表格模型。