Mar, 2023

一种基于指标的无休止赌博任务分配策略:为拉动机械臂工人争取公平

TL;DR本文研究在资源受限条件下随机过程的干预规划问题,并提出了一种解决异构工人的多工人多臂不懈赌博机问题的方法。通过开发基于指标的调度策略和 Whittle 指数的多工人扩展,实现公平性和高收益的干预计划。最后的实验结果表明,该方法在公平性方面表现优异,而在奖励积累方面只有轻微的牺牲。