关键词successive elimination algorithm
搜索结果 - 3
- 多臂赌博机中的可复制性是渐进自由的
研究论文的主题是关于可复现机器学习中的随机多臂赌博问题,介绍了一个确保算法行动序列不受数据集内固有随机性影响的可复现算法,同时提出了探索 - 执行算法和连续淘汰算法,并扩展了对线性赌博问题的应用。
- ICML加权记分贝叶斯多臂老虎机算法:通过重复曝光优化解决计算难题
研究了一个权重计数的赌博算法,其中动作损失与最近 $m$ 个时间步骤中该动作被播放的次数的加权求和有关,并引入了 “重复暴露最优性” 的条件来最小化完备策略遗憾,提出了简单的修改后的连续消除算法,并对其进行了理论和实验分析。
- AAAI最大 - 最小分组赌博机
介绍了一种多臂赌博机问题,称为最大最小分组赌博机问题,其中将赌臂分组,并旨在找到最差赌臂平均回报最高的组;提出两种基于连续淘汰和鲁棒优化的算法,并导出保证找到最优或接近最优组的样本数的上界,以及一个独立于算法的下界。探讨了各种相关情况下上下