May, 2024

使用表格和深度强化学习的吉廷斯指数

TL;DR提出了一种基于退休公式的表格 (QGI) 和深度强化学习 (DGN) 算法来学习 Gittins 指标,在大状态空间问题中运行时间更短、存储空间要求更低 (QGI 中小的 Q 表尺寸,DGN 中较小的重放缓冲区),并且展现了更好的实证收敛性,是现有方法的可行替代。