May, 2017

基于贝叶斯的梯度和赌博机学习统一加速全局优化

TL;DR本文提出了一种贝叶斯方法,它将基于贪心的优化和基于梯度的优化相结合,并使用贝叶斯可信区间来权衡探索和利用。实验结果表明,该方法在广泛的问题环境中改善了性能,为元优化和梯度相关信息能够获得的应用程序提供了改进的性能。