本研究提出了一种新的模型选择聚合算法 (Q-aggregation),并实现了利用该算法构建精确稀疏聚合模型的贪婪 Q 聚合过程,在最小最大意义下实现了最优的神谕不等式。
Mar, 2012
针对在线学习推荐的一种变体聚合算法,该算法基于广义聚合函数,具有与 AA 相似的理论性质,如贝叶斯更新和对广义和损失的时间无关边界。
Jun, 2024
本文探讨采用贝叶斯估计器与指数化最小二乘损失来进行偏差最优的模型平均,通过建立两种方法之间的原始对偶关系并提出新的贪心方法,规避了现有 $Q$- 聚合算法的局限性。
Aug, 2014
本篇研究文章探讨了针对各种概率模型使用 Kullback-Leibler 距离的模型选择类型聚合问题。文章提出了两种聚合方法,并使用惩罚极大似然准则选择聚合权重,给出了高概率的锐利的神谕不等式和相应的下界结果。
Jan, 2016
本文研究了聚合理论中的统计学设置,并通过用较小的局部复杂度替换全局复杂度来加强经典聚合理论的结果,包括基于 Leung 和 Barron 的指数权重估计器的局部经典简单限制,并针对 Q - 聚合估计器提出了偏差最优限制。
Jun, 2023
本文提出一个本地极小极大方法,分析了计算强化学习下的最优 $Q$ 值函数的实例特定行为,并提供一个针对 $Q$ 学习中困难问题和易解问题的有力解释。
Jun, 2021
本文介绍了在确定性设计下,回归设置中的简单聚合问题,并将其从高斯分布扩展到指数族分布。通过约束和 / 或罚分最大化方法解决此问题并导出了能够在期望和高概率情况下保持的谐振不等式。最后,证明了所有边界在最小化意义上都是最优的。
Nov, 2009
该研究论文研究了有限估计器或分类器的模型选择类型聚合问题,通过简单递归程序构建了一个新的估计器或分类器,并探讨了回归、分类和密度估计等几个问题。
Nov, 2005
采用指数权重的综合方法,在边际假设下,对于铰链风险(hinge risk),获得了凸聚合的最优速率。 此外,在边际假设下,对于超额贝叶斯风险,获得了模型选择聚合的最优速率。
Mar, 2006
研究了确定性系统中基于函数逼近的 agnostic Q-learning 问题,并提出了一种新颖的递归算法,证明了采用该算法可以找到最优策略,同时满足多项约束条件。
Feb, 2020