先验数据拟合网络的统计基础
本文介绍了 Prior-Data Fitted Networks (PFN) 方法,该方法利用大规模机器学习技术来逼近大量的后验概率。PFN 的目标是将后验逼近问题表述为带有集合值输入的监督分类问题,并展示了在多种不同领域的强大效果。
Dec, 2021
该论文介绍了如何利用 Prior-data Fitted Networks (PFNs) 在贝叶斯优化中作为一种灵活的代理模型,并演示了 PFN 在人工高斯过程和超参数优化测试方面的效用。
May, 2023
给定一种预先训练的 TabPFN 对于表格数据,如何将标注的训练样本进行摘要以便输入模型是最佳的方法?我们对 TabPFN 进行了定购和特征选择方法的初步研究,并注意到它与传统拟合表格模型之间的某些关键差异。
Nov, 2023
本研究论文通过利用先验数据拟合的神经网络模型(PFN),将贝叶斯推断应用于学习曲线外推,实现更准确且高效的后验预测分布,并展示了该模型在模型选择中的潜在应用,证明基于 LC-PFN 的预测性提前停止准则在 45 个数据集上可以实现 2-6 倍的加速且几乎没有额外的开销。
Oct, 2023
该研究提出了一种名为 Prior Networks(PNs)的框架来模型化分类任务中的数据和分布不确定性,并在 MNIST 数据集上实现了对 OOD 样本的识别和误分类的检测,与之前的方法相比,PNs 具有更好的表现。
Feb, 2018
本研究提出了一种名为 ForecastPFN 的零样本预测模型,通过对一种新型合成数据分布进行训练,实现对新的时间序列数据集的快速准确预测,并证明其在准确性和速度上优于现有的预测方法。
Nov, 2023
本文介绍了一种新的可交换随机过程 —— 函数神经过程(FNPs),它们通过学习数据集中点的潜在表示的依赖关系图,对函数分布进行建模。作者在不明确设定潜在全局参数的先验分布的情况下,采用了对给定数据集的关系结构的先验分布来定义贝叶斯模型,并通过小批量优化提高了可扩展性。作者还展示了如何通过后验预测分布对新点进行预测,并在玩具回归和图像分类任务上实验评估了 FNPs,证明了相比采用全局潜在参数的基准模型,FNPs 不仅提供了竞争性的预测性能,而且更具鲁棒性的不确定性估计。
Jun, 2019
通过构建数据过滤网络,该论文研究了大训练集上数据筛选的问题,并基于该网络构建了新的图像 - 文本数据集,为状态 - of-the-art 模型训练提供了高性能数据集,同时还释放了可从公开数据从头训练高性能数据过滤网络的新的 200 亿样本数据集,以促进数据集设计的进一步研究。
Sep, 2023
本研究综述了最近的预训练基础模型技术的研究进展,重点探讨了这些技术在文本、图像、图形以及其他数据模态中的应用前景、挑战和机遇,同时也讨论了这些技术的基本组成、现有预训练方法和未来趋势。
Feb, 2023
本文延伸了 Prior Networks 和 EnD$^2$ 模型,通过正态 - 旺季分布,将其应用于回归任务,实现模型的可解释性、不确定性而保留高精度,相关实验结果表明该模型在各领域均表现出与集成模型相当的性能。
Jun, 2020