贪心 Q 聚合的偏差优化学习

Mar, 2012

Deviation optimal learning using greedy Q-aggregation

Dong Dai, Philippe Rigollet, Tong Zhang

TL;DR本研究提出了一种新的模型选择聚合算法 (Q-aggregation)，并实现了利用该算法构建精确稀疏聚合模型的贪婪 Q 聚合过程，在最小最大意义下实现了最优的神谕不等式。

Abstract

Given a finite family of functions, the goal of model selection aggregation is to construct a procedure that mimics the function from this family that is the closest to an unknown regression function. More precis

model selection aggregation regression function mean squared error q-aggregation oracle inequalities

发现论文，激发创造

Q - 聚合最优学习

研究具有强凸和 Lipschitz 损失的一般监督学习问题，研究模型选择集成问题。证明了 Q-aggregation 过程将产生期望和高概率上都满足最优 Oracle 不等式的估计器。

Jan, 2013

指数最小平方损失贝叶斯模型平均

本文探讨采用贝叶斯估计器与指数化最小二乘损失来进行偏差最优的模型平均，通过建立两种方法之间的原始对偶关系并提出新的贪心方法，规避了现有 $Q$- 聚合算法的局限性。

Aug, 2014

一种公理化方法的损失汇总及适应性汇总算法

针对在线学习推荐的一种变体聚合算法，该算法基于广义聚合函数，具有与 AA 相似的理论性质，如贝叶斯更新和对广义和损失的时间无关边界。

Jun, 2024

Kullback-Leibler 聚合和错误指定的广义线性模型

本文介绍了在确定性设计下，回归设置中的简单聚合问题，并将其从高斯分布扩展到指数族分布。通过约束和 / 或罚分最大化方法解决此问题并导出了能够在期望和高概率情况下保持的谐振不等式。最后，证明了所有边界在最小化意义上都是最优的。

Nov, 2009

镜像平均学习

该研究论文研究了有限估计器或分类器的模型选择类型聚合问题，通过简单递归程序构建了一个新的估计器或分类器，并探讨了回归、分类和密度估计等几个问题。

Nov, 2005

最优值估计中的实例最优性：通过方差缩减 Q 学习实现自适应

本文提出一个本地极小极大方法，分析了计算强化学习下的最优 $Q$ 值函数的实例特定行为，并提供一个针对 $Q$ 学习中困难问题和易解问题的有力解释。

Jun, 2021

Kullback-Leibler 损失函数估计器合并的最优指数界

本篇研究文章探讨了针对各种概率模型使用 Kullback-Leibler 距离的模型选择类型聚合问题。文章提出了两种聚合方法，并使用惩罚极大似然准则选择聚合权重，给出了高概率的锐利的神谕不等式和相应的下界结果。

Jan, 2016

线性函数逼近下的最小化最优离线策略评估

本文研究利用函数逼近的批量数据强化学习的统计理论，针对离线策略评估问题提出了基于回归的适应 Q 迭代方法，证明该方法是信息理论上的最优方法，错误估计接近最小，进而提供容易计算的置信区间，该方法在乐观规划和安全策略改进中可能有用

Feb, 2020

通用损失下的最优二分类器集成

本文旨在解决半监督二分类集合聚合问题，以最小化在未标记数据上产生的预测损失，并找到了一类最小 - 最大最优预测。结果是一组半监督集合聚合算法，能像线性学习一样高效，但无需放松任何限制。它们的决策规则采用决策理论中熟悉的形式，将 Sigmoid 函数应用于集合边缘的概念，而不需要通常在基于边缘的学习中做出的假设。

Oct, 2015

二次模型的子模选择观测和信息收集

研究在机器学习和信号处理中选择最具信息量的子集以实现对未知参数精确估计的问题。我们使用 Van Trees 不等式的联系来推导新的字母最优性标准，并开发了一个针对二次模型独特定制的高效贪心观测选择算法，并提供了其可实现效率的理论界限。

May, 2019