Aug, 2024

非短视贝叶斯优化的政策区分

TL;DR本文研究了贝叶斯优化中采样点选择的有效性,指出标准的采集函数过于短视,未能考虑长期收益。提出了一种新的方法,通过有效估计采集函数及其梯度,实现了基于随机梯度的采样政策优化。研究结果表明,该方法能够显著提高采样效率,促进贝叶斯优化在复杂任务中的应用。