研究具有强凸和 Lipschitz 损失的一般监督学习问题,研究模型选择集成问题。证明了 Q-aggregation 过程将产生期望和高概率上都满足最优 Oracle 不等式的估计器。
Jan, 2013
本文探讨采用贝叶斯估计器与指数化最小二乘损失来进行偏差最优的模型平均,通过建立两种方法之间的原始对偶关系并提出新的贪心方法,规避了现有 $Q$- 聚合算法的局限性。
Aug, 2014
针对在线学习推荐的一种变体聚合算法,该算法基于广义聚合函数,具有与 AA 相似的理论性质,如贝叶斯更新和对广义和损失的时间无关边界。
Jun, 2024
本文介绍了在确定性设计下,回归设置中的简单聚合问题,并将其从高斯分布扩展到指数族分布。通过约束和 / 或罚分最大化方法解决此问题并导出了能够在期望和高概率情况下保持的谐振不等式。最后,证明了所有边界在最小化意义上都是最优的。
Nov, 2009
该研究论文研究了有限估计器或分类器的模型选择类型聚合问题,通过简单递归程序构建了一个新的估计器或分类器,并探讨了回归、分类和密度估计等几个问题。
Nov, 2005
本文提出一个本地极小极大方法,分析了计算强化学习下的最优 $Q$ 值函数的实例特定行为,并提供一个针对 $Q$ 学习中困难问题和易解问题的有力解释。
Jun, 2021
本篇研究文章探讨了针对各种概率模型使用 Kullback-Leibler 距离的模型选择类型聚合问题。文章提出了两种聚合方法,并使用惩罚极大似然准则选择聚合权重,给出了高概率的锐利的神谕不等式和相应的下界结果。
Jan, 2016
本文研究利用函数逼近的批量数据强化学习的统计理论,针对离线策略评估问题提出了基于回归的适应 Q 迭代方法,证明该方法是信息理论上的最优方法,错误估计接近最小,进而提供容易计算的置信区间,该方法在乐观规划和安全策略改进中可能有用
Feb, 2020
本文旨在解决半监督二分类集合聚合问题,以最小化在未标记数据上产生的预测损失,并找到了一类最小 - 最大最优预测。结果是一组半监督集合聚合算法,能像线性学习一样高效,但无需放松任何限制。它们的决策规则采用决策理论中熟悉的形式,将 Sigmoid 函数应用于集合边缘的概念,而不需要通常在基于边缘的学习中做出的假设。
Oct, 2015
研究在机器学习和信号处理中选择最具信息量的子集以实现对未知参数精确估计的问题。我们使用 Van Trees 不等式的联系来推导新的字母最优性标准,并开发了一个针对二次模型独特定制的高效贪心观测选择算法,并提供了其可实现效率的理论界限。
May, 2019