BriefGPT.xyz
Ask
alpha
关键词
combinatorial bandits
搜索结果 - 5
具上下文的组合赌博机、概率挑战的手臂
本文针对情境组合赌博问题,提出了一种具有触发概率和方差自适应的算法,并给出了相应的遗憾界。在合成和真实世界数据集上的实验结果表明算法的优越性。
PDF
a year ago
IJCAI
组合赌博分配中的有序优先级排序
通过使用组合赌博,我们提出了一种名为 RankedCUCB 的算法来保护濒危物种,该算法可以在考虑到优先顺序的情况下优化固定的巡逻资源,并在实验中表现出多达 38% 的性能提升。
PDF
2 years ago
用于转导线性赌博机的连续实验设计
本文介绍了传导式线性赌博机问题,提供了该问题的上下界和算法,并给出其评估结果,特别地,提供了第一个实现信息论下界的非相似线性赌博机算法。
PDF
5 years ago
带有完全赌博反馈的 Top-k 组合赌博
本研究通过引入 Hadamard 矩阵,提出了一种通用的 CSAR 算法用于解决 top-k 组合赌博问题,针对完全赌博反馈,该算法仅观察奖励总和,在两个变体的算法中,第一个最小化样本复杂性,第二个最小化遗憾,并证明了样本复杂度的下限,该复
→
PDF
5 years ago
基于非当前策略的推荐策略评估
本文研究了基于上下文的推荐策略(例如排名)的评估方法,在组合赌博技术的基础上引入了一种新的实用估计量,该方法可以使用已记录的数据估计政策的绩效,经过全面的实证评估,我们的估计器在多种设置下都很准确,包括在学习排序任务中作为子程序,我们导出了
→
PDF
8 years ago
Prev
Next