Feb, 2022

多臂赌博机中的可扩展决策焦点学习及其在母婴健康中的应用

TL;DR本文提出了一种新颖的用于决策焦点学习的方法,该方法直接训练预测模型以最大化 Whittle 指数解的质量,应用于不确定武装转移动态但已知相关武装特征的不安静多臂老虎机(RMAB)问题,并提高了在 RMAB 问题中的可扩展性,并将算法应用于先前收集的母婴健康数据集,展示了其性能。