- 未知方差的双臂高斯赌博机中局部最优固定预算最佳臂识别
我们提出了一种在自适应实验中估计方差的策略,并展示了在变量未知情况下该策略在渐近情况下是最优的。
- 改进知识梯度算法
改进的知识梯度(iKG)算法通过选择产生在选择最佳臂的概率的一步改进最大的度量,提供了知识梯度(KG)算法的一个修复方案,并且可以被证明是渐近最优的。
- 最佳挑战规则下的贝叶斯臂选择中的汤姆森探索
该论文研究了在集中置信度下的最佳臂识别问题,提出了一种结合汤普森采样和最佳挑战者规则的策略,在样本复杂度较低的情况下取得了近乎最优的性能。
- 线性上下文臂优化中的自适应探索
我们设计了一种渐近上限最优算法,并充分利用线性结构和精确探索,从而减少了在多种合理情境下的失算,数值结果表明,与其他基准算法相比,我们的方法大大减少了失算。
- 阈值型赌博机带有最优聚合遗憾
本文提出了 LSA 算法,用于解决阈值赌博机问题,证明了该算法在实例方面渐近最优,通过多种不同情况下的实证结果证明其优于现有算法的表现。
- 随机优化中更好模型的重要性
通过研究随机最小化和学习问题的模型,我们提出了一种更具鲁棒性的解决方案。通过适当精确的模型,即所谓的 aProx 系列,随机最优化方法可以稳定,可证明收敛且渐近最优。我们将这些结果扩展到弱凸目标,其中包括凸损失与光滑函数的组合,在现代机器学 - 本地化
针对现代硬件上的程序性能特征之一 —— 引用局部性,本文证明了一种渐进最优的算法在所有奖励引用局部性的系统中都是渐进最优的,即使在理想缓存模型中,缓存遗忘框架虽然并未针对直接建模引用局部性的相关性能,但可排除某些病态情况下在合理设置下得到渐 - 关于利用专家建议进行预测的组合策略的渐近最优性
研究通过专家意见在对抗环境中进行预测问题时, 单独使用几何停止规则会导致过于保守的策略, 因此使用 comb 策略(在 4 个专家情况下为最优)来提高择优性能。
- 自适应重要性抽样的渐近最优性
本文提出了自适应重要性采样方法,并探讨了采样策略和权重更新对采样效率产生的影响。除此之外,还介绍了一种新的加权采样方法,可以帮助快速排除低效样本。
- 一种极小极大算法及渐进最优算法用于随机赌博机
本文提出了 kl-UCB ++ 算法,用于在具有指数分布族的随机赌博机模型中实现遗憾最小化,并证明了其同时渐近最优(按 Lai 和 Robbins 的下限界定)和极小化最优。这是第一种证明同时具有这两个性质的算法,因此将两种不同的研究方向合 - 固定置信度下的最优臂识别
本研究完整表征了单参数赌博机问题中最优臂识别的复杂度,并提出了一种被称作 “Track-and-Stop” 的策略,该策略通过的新采样规则和所提出的 Chernoff 停止规则被证明是渐近最优的,并在样本复杂度上取得了一个新的紧致下界。
- 确定性采样式运动规划:最优性,复杂度,和性能
该研究论文探究了将确定性的低离散度采样序列应用于机器人运动规划中的概率采样算法,并证明了其渐近最优性,并通过数值实验验证了其在路径成本和成功率方面表现出更高的性能。
- 基于采样的最优路径规划算法
本文介绍了一种新的算法 PRM * 和 RRT*,证明了它们是渐近最优的,并且在样本数增加的情况下,它们的解决方案成本几乎肯定收敛于最优值。这些算法的计算复杂度与传统的,但不是渐近最优的算法相当。