Apr, 2024

上下文冷热贝叶斯优化:超参数优化

TL;DR本文提出了一种名为 FT-PFN 的新型先验数据拟合网络,它利用了 transformer 在上下文学习方面的能力,以单次前向传播的方式高效可靠地进行贝叶斯学习曲线推断。经验证实,FT-PFN 的预测比之前工作中使用的深高斯过程和深度集成模型更准确且速度快 10-100 倍,并结合新颖的采样机制(MFPI-random)应用于深度学习超参数优化任务中,取得了新的同类任务的最好性能。