有界随机变量的接近最优置信区间
本文根据非参数条件下的迭代对数率法则和序贯概率比检验,建立了一种置信序列,可以在无限时间轴上逐渐逼近零宽度,并推广了指数集中方法,对子高斯和伯恩斯坦条件,自标准化过程和矩阶鞅等非参数条件下的置信序列进行了紧密的非渐近性描述,同时将这些证明技巧推广到协方差矩阵估计和样本平均处理效应估计领域。
Oct, 2018
该研究论文提出了一种置信度序列方法,可用于跟踪任何完全排序集合上的分布分位数,同时提供了新的经验分布函数的集中不等式,并在多臂老虎机框架中提供了选择玩家的新算法和样本复杂度边界。
Jun, 2019
基于似然比的推理原则重新考虑,提出了使用似然比构建任意时间有效的置信序列方法,适用于具有良好似然度的问题,而且结果保持模型无关的预定覆盖率;同时,研究了如何选择最佳的估计器序列以及与在线凸优化算法(例如 Follow-the-Regularized-Leader)的关联,提出了一种去偏的重新加权方案,可用于非参数设置,并通过非渐近分析确定了广义线性模型中的置信集大小,并在广义线性赌博机问题、生存分析和带有不同加性噪声分布的赌博机上展示了方法的实际优势。
Nov, 2023
基于赌注方法构建的置信区间和置信序列在理论上具有更强的保证,无论是在渐近还是有限样本情况下,其经验证明在经验性能上优于现有的经验伯恩斯坦置信区间和置信序列。
Oct, 2023
通过利用少量的独立多轮运行获得分布信息并构建基于 t 分布的置信区间,在保证高置信水平的前提下,提出了一种快速计算收敛到名义水平置信区间的新型推断方法,几乎不需要额外的计算和内存开销。
Jan, 2024
利用鞅尾巴界限和有限维无限维凸规划的重构,为序列核回归建立了新的置信界限,证明在此设置中,我们的新置信界限始终比现有界限更严格。将我们的置信界限应用于核赌博问题时,当我们的置信界限取代现有界限时,KernelUCB(GP-UCB)算法在实证性能、最坏情况性能保证和计算成本方面具有更好的表现。我们的新置信界限可以作为设计改进的其他核化学习和决策问题算法的通用工具。
Mar, 2024
本文提出了一种基于乘数 bootstrap 的非参数和数据相关的 UCB 算法,并进一步将二阶校正融入该算法,在理论上,我们推导出了在比标准次高斯性更弱的尾部假设下的多臂老虎机的问题相关和问题无关的后悔边界,数值结果表明 UCB 算法相比其他基线在一系列多臂和线性老虎机问题中都有显著的降低后悔
Jun, 2019
该论文提出了一种用于高维模型中单个或低维组件的置信区间和统计检验的一般方法,可轻松调整用于考虑测试之间的依赖关系。该方法还自然地扩展到具有凸损失函数的广义线性模型。
Mar, 2013