Q - 聚合最优学习 | BriefGPT

Jan, 2013

Q - 聚合最优学习

Optimal learning with $Q$-aggregation

Guillaume Lecué, Philippe Rigollet

TL;DR研究具有强凸和 Lipschitz 损失的一般监督学习问题，研究模型选择集成问题。证明了 Q-aggregation 过程将产生期望和高概率上都满足最优 Oracle 不等式的估计器。

Abstract

We consider a general supervised learning problem with strongly convex and Lipschitz loss and study the problem of model selection aggregation. In particular, given a finite dictionary functions (learners) togeth

supervised learning model selection aggregation optimality oracle inequalities empirical process

发现论文，激发创造

贪心 Q 聚合的偏差优化学习

本研究提出了一种新的模型选择聚合算法 (Q-aggregation)，并实现了利用该算法构建精确稀疏聚合模型的贪婪 Q 聚合过程，在最小最大意义下实现了最优的神谕不等式。

Mar, 2012

一种公理化方法的损失汇总及适应性汇总算法

针对在线学习推荐的一种变体聚合算法，该算法基于广义聚合函数，具有与 AA 相似的理论性质，如贝叶斯更新和对广义和损失的时间无关边界。

Jun, 2024

指数最小平方损失贝叶斯模型平均

本文探讨采用贝叶斯估计器与指数化最小二乘损失来进行偏差最优的模型平均，通过建立两种方法之间的原始对偶关系并提出新的贪心方法，规避了现有 $Q$- 聚合算法的局限性。

Aug, 2014

Kullback-Leibler 损失函数估计器合并的最优指数界

本篇研究文章探讨了针对各种概率模型使用 Kullback-Leibler 距离的模型选择类型聚合问题。文章提出了两种聚合方法，并使用惩罚极大似然准则选择聚合权重，给出了高概率的锐利的神谕不等式和相应的下界结果。

Jan, 2016

统计汇聚的本地风险界限

本文研究了聚合理论中的统计学设置，并通过用较小的局部复杂度替换全局复杂度来加强经典聚合理论的结果，包括基于 Leung 和 Barron 的指数权重估计器的局部经典简单限制，并针对 Q - 聚合估计器提出了偏差最优限制。

Jun, 2023

最优值估计中的实例最优性：通过方差缩减 Q 学习实现自适应

本文提出一个本地极小极大方法，分析了计算强化学习下的最优 $Q$ 值函数的实例特定行为，并提供一个针对 $Q$ 学习中困难问题和易解问题的有力解释。

Jun, 2021

Kullback-Leibler 聚合和错误指定的广义线性模型

本文介绍了在确定性设计下，回归设置中的简单聚合问题，并将其从高斯分布扩展到指数族分布。通过约束和 / 或罚分最大化方法解决此问题并导出了能够在期望和高概率情况下保持的谐振不等式。最后，证明了所有边界在最小化意义上都是最优的。

Nov, 2009

镜像平均学习

该研究论文研究了有限估计器或分类器的模型选择类型聚合问题，通过简单递归程序构建了一个新的估计器或分类器，并探讨了回归、分类和密度估计等几个问题。

Nov, 2005

低噪声假设下分类聚合的最优速率

采用指数权重的综合方法，在边际假设下，对于铰链风险（hinge risk），获得了凸聚合的最优速率。此外，在边际假设下，对于超额贝叶斯风险，获得了模型选择聚合的最优速率。

Mar, 2006

确定性系统中基于函数逼近的无神论 Q 学习：逼近误差和样本复杂度的严格界限

研究了确定性系统中基于函数逼近的 agnostic Q-learning 问题，并提出了一种新颖的递归算法，证明了采用该算法可以找到最优策略，同时满足多项约束条件。

Feb, 2020