在规格不匹配设定下的通用批次学习

May, 2024

在规格不匹配设定下的通用批次学习

Universal Batch Learning Under The Misspecification Setting

Shlomi Vituri, Meir Feder

TL;DR在该论文中，我们考虑了在误差设置下的通用批次学习问题，其中假设类是一个模型集合，但数据是由未知分布生成的，可能不属于该集合，而是来自一个更大的模型集合。我们利用极小极大定理和信息论工具，推导出最优的通用学习器，即数据生成分布集合上的混合分布，获得了最小最大遗憾的闭式表达式。我们发展了一种扩展的Arimoto-Blahut算法用于遗憾值和达到容量的先验分布的数值评估。对于观测结果来自K个参数的多项式分布，而假设类是该分布族的子集的情况，我们展示了我们的结果。

Abstract

In this paper we consider the problem of universal {\em batch} learning in a misspecification setting with log-loss. In this setting the hypothesis class is a set of models $\Theta$. However, the data is generate

发现论文，激发创造

个体数据通用监督学习

本文从信息论的角度探讨了通用监督学习问题，提出了一个名为Predictive Normalized Maximum Likelihood (pNML)的学习方案，并证明其在特定测试任务的学习能力超过了当前基于经验风险最小化(ERM)的领先方法。

Dec, 2018

组合赌博机与相对反馈

本文围绕多项式逻辑选择模型，研究了在线学习中集合选择的组合优化问题及其相关算法，并通过实验验证了理论结果。

Mar, 2019

贝叶斯学习中的最小超额风险

本文探讨了基于生成模型下贝叶斯学习的最佳性能，并通过定义和上界最小超额风险（MER）来说明不同不确定性的概念，包括 aleatoric 不确定性和最小认知不确定性。

Dec, 2020

关于批化策略优化算法的最优性

提出一种称为置信回报指数算法的类别与加权极小极大准则，用于解决有限武装随机赌徒问题中的批处理策略优化。研究表明，任何置信回报指数算法都是极小极大优的，无论乐观、悲观还是中性。同时，我们还演示了如何使用加权极小极大准则来证明通常用于批处理策略优化的悲观原则。

Apr, 2021

通过根对数正则化实现Minimax最优分位数和半对抗性遗憾

利用FTRL算法具有不同的正则化器降低Quantile和KL regret bounds，与 NormalHedge 和其变体相比，成功完成对抗数据中对大多数专家而不是最佳专家进行竞争，并在半对抗范式中使用自适应最小值的算法来适应真实、未知的约束条件，导致了统一改进的regret上限。

Oct, 2021

在希尔伯特空间中改进的自标准化集中度：GP-UCB的次线性遗憾

本文解决了若干向来未解的开放性问题，提供了超线性收敛速度，证明了 GP-UCB 算法在大多数流行核函数上具有最优回报，且证明了简化版本的自标准化集中不等式和超鞅技术是关键技术工具。

Jul, 2023

通过顺序预测器获得高概率风险边界

在线学习方法在最小假设下产生顺序遗憾界限，并为统计学习提供期望风险界限；然而，最近的研究结果表明，在许多重要情况下，遗憾界限可能无法保证统计背景下紧致的高概率风险界限。本研究通过将通用在线学习算法应用于在线到批次转换，通过对定义遗憾的损失函数进行一般的二阶校正，获得了几个经典统计估计问题（如离散分布估计、线性回归、逻辑回归和条件密度估计）的几乎最优的高概率风险界限；我们的分析依赖于在线学习算法的不恰当性，因为它们不限制使用给定参考类别的预测器；我们的估计器的不恰当性使得在各种问题参数上显著改善了依赖；最后，我们讨论了我们的顺序算法与现有批处理算法之间的一些计算上的优势。

Aug, 2023

多分布最优学习

多分布学习中的自适应采样算法解决了最坏情况风险最小化问题，并提供了样本复杂度的最优解，同时证明了随机化的必要性。

Dec, 2023

批次通用预测

大语言模型(LLMs)最近因其生成类似人类的英语句子的惊人能力而受到广泛关注。为了公平地评估它们的性能，我们引入了批次遗憾的概念作为经典平均遗憾的修正，并研究了在无记忆源和一阶马尔可夫源的情况下，加常数预测器的渐近值。

Feb, 2024

线性马尔可夫决策过程中的常数遗憾解决

我们研究了强化学习中的恒定遗憾保证问题，提出了一种算法 Cert-LSVI-UCB，用于在线性马尔科夫决策过程中近似转移核和奖励函数，利用认证估计器进行集中分析，证明了其对于无限次运行具有恒定的遗憾边界，不依赖先验分布假设。

Apr, 2024