May, 2024
使用表格和深度强化学习的吉廷斯指数
Tabular and Deep Reinforcement Learning for Gittins Index
Harshit Dhankar, Kshitij Mishra, Tejas Bodas
TL;DR提出了一种基于退休公式的表格 (QGI) 和深度强化学习 (DGN) 算法来学习 Gittins 指标,在大状态空间问题中运行时间更短、存储空间要求更低 (QGI 中小的 Q 表尺寸,DGN 中较小的重放缓冲区),并且展现了更好的实证收敛性,是现有方法的可行替代。