Feb, 2023

基于遗传多臂赌博机的通过仿真进行离散优化的强化学习方法

TL;DR本文提出了一种新算法 GMAB,将强化学习领域的多臂赌博机和遗传算法中的随机搜索策略相结合,通过模拟来解决离散随机优化问题。实验结果表明,GMAB 在大量测试问题中取得了优越的性能。