Aug, 2024

无界上下文分布的上下文赌博机

TL;DR本文解决了无界上下文的非参数上下文赌博机问题,填补了现有研究在这一领域的空白。提出了两种结合UCB探索的最近邻方法,其中第二种方法通过自适应选择邻居数量,达到了大部分情况下的最优后悔界限,为无界上下文的在线决策提供了有效的解决方案。