Jul, 2023

具有因果相关奖励的分段静态组合半匹配波尔制

TL;DR本研究探讨具有因果关系奖励的分段稳定组合半强盗问题,在我们的非稳态环境中,基本臂的分布变化,奖励之间的因果关系,或者二者同时改变了奖励生成过程。我们提出的算法在复杂环境中具备优越的应用性能。