Mar, 2024

ε- 贪婪汤普森采样用于贝叶斯优化

TL;DR改良的 Thompson 抽样方法(TS)在贝叶斯优化(BO)中解决了利用 - 探索困境问题,在通过随机生成和最大化高斯过程(GP)后验样本路径来优先进行探索的同时,引入了 epsilon-greedy 策略来管理其利用,该策略随机在两种极端之间切换,从而平衡了两者的需求,并通过实验证明了该方法的有效性。