Jun, 2011

紧密下限优化的健壮贝叶斯强化学习

TL;DR本文提出贝叶斯强化学习中近似最优的无记忆策略,用以计算相关效用较紧的下界, 使之得以应用于提高决策探索策略的鲁棒性。