BriefGPT.xyz
Ask
alpha
关键词
constrained contextual bandits
搜索结果 - 2
基于延迟反馈的预算推荐
在有限的资源和延迟反馈的情况下,研究了延迟反馈对约束上下文多臂赌博问题的影响,并开发了一种决策策略(DORAL),以优化资源在具有依赖延迟反馈的上下文多臂赌博问题中的使用。
PDF
2 months ago
NIPS
具有对数或次线性遗憾的约束上下文臂机算法
本文对具有预算和时间限制的约束情境赌博问题展开了研究,提出了一种高效算法 UCB-ALP 以实现对其进行近似求解并达到对数遗憾。
PDF
9 years ago
Prev
Next