为表格先验数据拟合网络缩放的草图和特征选择
TabPFN 是一个训练有素的 Transformer,可对小型表格数据集进行监督分类,无需调整超参数,并且在与最先进的分类方法竞争中具有竞争力,它彻底包含在我们网络的权重中,并接受训练和测试样本以及一系列值输入,并在单个前向传递中为整个测试集产生预测,其先验扩展了因果推理的一些想法,适用于预测与给定输入和输出相关的结构因果模型。
Jul, 2022
该研究论文探讨了先验数据拟合网络(PFN)的理论基础,以及控制其行为的统计机制。虽然 PFN 是受贝叶斯思想启发的,但其行为可以纯粹地以预调整但未经训练的预测器来解释。
May, 2023
本文介绍了 Prior-Data Fitted Networks (PFN) 方法,该方法利用大规模机器学习技术来逼近大量的后验概率。PFN 的目标是将后验逼近问题表述为带有集合值输入的监督分类问题,并展示了在多种不同领域的强大效果。
Dec, 2021
该论文介绍了如何利用 Prior-data Fitted Networks (PFNs) 在贝叶斯优化中作为一种灵活的代理模型,并演示了 PFN 在人工高斯过程和超参数优化测试方面的效用。
May, 2023
针对高维、小样本的表格型生物医学数据,我们提出了一种 Weight Predictor Network with Feature Selection(WPFS)神经网络。该网络通过特征选择和参数减少来学习高维、小样本数据,具有较好的性能,并提供了有用的学习洞察。
Nov, 2022
通过引入预训练语言模型(PTM)和三个处理阶段(MT、MF、CF),提出了一种新的名为 PTab 的框架,以将预训练模型用于建模表格数据,并取得比现有技术更好的分类效果。
Sep, 2022
本研究论文通过利用先验数据拟合的神经网络模型(PFN),将贝叶斯推断应用于学习曲线外推,实现更准确且高效的后验预测分布,并展示了该模型在模型选择中的潜在应用,证明基于 LC-PFN 的预测性提前停止准则在 45 个数据集上可以实现 2-6 倍的加速且几乎没有额外的开销。
Oct, 2023
本篇研究提出了一种名为 PFENet 的模型,包含了训练无关先验蒙版生成方法和特征增强模块,用以解决高级语义信息和空间目标不一致导致的无法泛化的问题。在 PASCAL-5i 和 COCO 测试集上,我们的模型表现优于现有最先进方法,甚至在没有有标记支持样本的情况下也具有较强的泛化性能。
Aug, 2020
本文提出了 Tabular Foundation Models (TabFMs),通过在广泛的表格数据集上使用预训练的大型语言模型 (LLM) 并进行微调,实现了对表格数据具有深刻理解和普适能力的目标。TabFMs 在指导性任务(如零样本和上下文推理)方面具有显著优势,并且在某些情况下甚至超越了著名但神秘的闭源 LLMs,如 GPT-4。此外,当仅有有限的数据进行微调时,我们的模型表现出了出色的效率和竞争性表现。最后,我们也探讨了 TabFM 的局限性和潜在机会,旨在激发和促进未来开发更强大的 TabFMs 的研究。
Oct, 2023