AAAIDec, 2023

通过核密度估计的未知连续上下文分布的随机贝叶斯优化

TL;DR使用贝叶斯优化方法,利用核密度估计来在线学习连续环境变量的概率密度函数,提出了两个算法来优化函数在未知分布下的期望,实验证明这两个算法的效果有效。