有界随机变量的接近最优置信区间

ICMLJun, 2020

有界随机变量的接近最优置信区间

Near-Optimal Confidence Sequences for Bounded Random Variables

Arun Kumar Kuchibhotla, Qinqing Zheng

TL;DR本研究提供了一种基于 Bentkus 集中结果的近乎最优置信序列，用于解决在线推断中随着样本大小不断增长需要统一有效置信区间的问题，证实这种置信序列在合成覆盖问题和自适应停止算法方面具有优越性。

Abstract

Many inference problems, such as sequential decision problems like A/B testing, adaptive sampling schemes like bandit selection, are often online in nature. The fundamental problem for online inference is to provide a sequence of →

online inference confidence intervals bentkus' concentration results random variables adaptive stopping algorithms

发现论文，激发创造

时间均匀的非参数非渐近置信序列

本文根据非参数条件下的迭代对数率法则和序贯概率比检验，建立了一种置信序列，可以在无限时间轴上逐渐逼近零宽度，并推广了指数集中方法，对子高斯和伯恩斯坦条件，自标准化过程和矩阶鞅等非参数条件下的置信序列进行了紧密的非渐近性描述，同时将这些证明技巧推广到协方差矩阵估计和样本平均处理效应估计领域。

Oct, 2018

应用于 A/B 测试和最佳臂识别的分位数序列估计

该研究论文提出了一种置信度序列方法，可用于跟踪任何完全排序集合上的分布分位数，同时提供了新的经验分布函数的集中不等式，并在多臂老虎机框架中提供了选择玩家的新算法和样本复杂度边界。

Jun, 2019

使用赌博方法估计有限随机变量的均值

本文引导出了计算未知均值的置信区间和时间均匀置信序列的一般方法，并应用于研究有界均值、有限抽样和无限抽样等多个问题。

Oct, 2020

序贯决策的似然比置信集

基于似然比的推理原则重新考虑，提出了使用似然比构建任意时间有效的置信序列方法，适用于具有良好似然度的问题，而且结果保持模型无关的预定覆盖率；同时，研究了如何选择最佳的估计器序列以及与在线凸优化算法（例如 Follow-the-Regularized-Leader）的关联，提出了一种去偏的重新加权方案，可用于非参数设置，并通过非渐近分析确定了广义线性模型中的置信集大小，并在广义线性赌博机问题、生存分析和带有不同加性噪声分布的赌博机上展示了方法的实际优势。

Nov, 2023

有界均值的押注置信区间的近最优性

基于赌注方法构建的置信区间和置信序列在理论上具有更强的保证，无论是在渐近还是有限样本情况下，其经验证明在经验性能上优于现有的经验伯恩斯坦置信区间和置信序列。

Oct, 2023

使用并行随机优化几乎免费实现高置信度推断

通过利用少量的独立多轮运行获得分布信息并构建基于 t 分布的置信区间，在保证高置信水平的前提下，提出了一种快速计算收敛到名义水平置信区间的新型推断方法，几乎不需要额外的计算和内存开销。

Jan, 2024

顺序核回归的更紧置信区间

利用鞅尾巴界限和有限维无限维凸规划的重构，为序列核回归建立了新的置信界限，证明在此设置中，我们的新置信界限始终比现有界限更严格。将我们的置信界限应用于核赌博问题时，当我们的置信界限取代现有界限时，KernelUCB（GP-UCB）算法在实证性能、最坏情况性能保证和计算成本方面具有更好的表现。我们的新置信界限可以作为设计改进的其他核化学习和决策问题算法的通用工具。

Mar, 2024

线性赌博机的噪声自适应置信区间及其在贝叶斯优化中的应用

在线学习中通过与现有方法相比展示出更好或相当的性能，解决了适应未知噪声水平的问题，并提出了一种新的置信度集合与方差自适应方法。

Feb, 2024

自举式上置信域界限算法

本文提出了一种基于乘数 bootstrap 的非参数和数据相关的 UCB 算法，并进一步将二阶校正融入该算法，在理论上，我们推导出了在比标准次高斯性更弱的尾部假设下的多臂老虎机的问题相关和问题无关的后悔边界，数值结果表明 UCB 算法相比其他基线在一系列多臂和线性老虎机问题中都有显著的降低后悔

Jun, 2019

关于高维模型渐近最优置信区间和检验

该论文提出了一种用于高维模型中单个或低维组件的置信区间和统计检验的一般方法，可轻松调整用于考虑测试之间的依赖关系。该方法还自然地扩展到具有凸损失函数的广义线性模型。

Mar, 2013