Jan, 2017

通过在线重要性采样识别最佳干预措施

TL;DR通过在无环因果有向图中识别最佳软干预措施以最大化目标节点的预期价值,我们提出了一个最佳臂识别问题;本研究提供了该问题的第一篇基于不同操作开销的损失限制的误差和简单后悔边界的信息泄漏。经验性结果表明,我们的算法优于现有技术。