不可知的多组主动学习

Jun, 2023

Agnostic Multi-Group Active Learning

Nick Rittler, Kamalika Chaudhuri

TL;DR本论文提出了一种用于多组学习的主动学习算法，以最小化标签查询数并保持 PAC 学习保证，其中包括分类准确度，标签查询和不一致系数等关键词。

Abstract

Inspired by the problem of improving classification accuracy on rare or hard subsets of a population, there has been recent interest in models of learning where the goal is to generalize to a collection of distributions, each representing a ``group''. We consider a variant of this prob

active learning multi-group learning classification accuracy label queries disagreement coefficient

发现论文，激发创造

对于无先验知识主动学习的竞争算法

针对给定的二元假设类和分布，该研究提出了一种与最优算法相竞争的无偏主动学习算法，该算法在错误率为 η 的情况下只需要 O (m^* log |H|) 的查询次数，并且证明了超越 O (log |H|) 的开销是 NP 难的。

Oct, 2023

基于不同意的不可知主动学习方法的拓展

本文提出一个算法，利用一种 “从一致的主动学习到具有保证错误的置信度评估预测” 的减少，以及一种新颖的置信度评估预测器解决了确保标签复杂度更低的主动学习问题。

Jul, 2014

多组别不可知的 PAC 可学习性

通过对多个带敏感性群体的个体进行损失度量，本文提出了用于处理公平性关切的多组无知 PAC 可学习性算法，该算法可以保证在涵盖多个不同的群体时仍能保证所学分类器表现一致，通过联合和扩展以前针对特定损失函数的多组公平性文献中的研究，为包含敏感性群体的学习提供了一个统一的视角。

May, 2021

多分布学习的样本复杂度

这篇论文研究多分布学习，给出了一个样本复杂度为 $\widetilde {O}((d+k)\epsilon^{-2}) \cdot (k/\epsilon)^{o (1)}$ 的算法，解决了 COLT 2023 的开放问题。

Dec, 2023

无知地利用查询学习多索引模型

研究了高斯分布下对于无偏学习任务的查询访问权限的能力。聚焦于多指数模型（MIMs），研究表明查询访问权限在无偏学习 MIMs 方面相对于随机样本具有显著的运行时改进作用。

Dec, 2023

按需抽样：从多个分布中优化学习

该论文研究了多分配学习范式的最优样本复杂度，并给出了符合最优样本复杂度的算法。其中，他们的样本复杂度界限超过了仅学习单个分布的学习的样本复杂度。

Oct, 2022

分布无关可靠学习

研究可靠的不可知学习框架中的问题，使用单边多项式逼近可学习可靠分类器和构建适当的单边多项式逼近来学习大多数时完全可靠，这些算法还满足强属性效率属性并提供样本复杂度和运行时间之间的平滑折衷。

Feb, 2014

异方差分布上的神经主动学习

本研究展示了在异方差分布上运行的主流主动学习技术的灾难性失败，并提出了一种基于微调的方法以缓解这些失败，同时结合模型差别评分函数提出了一个新的算法，在清除噪声示例的同时最大化准确性，表现优异于现有的主动学习技术。

Nov, 2022

主动学习在最大似然估计中的收敛速率

通过交互查询子集示例的标签，主动学习器在模型类和大量未标记示例的情况下学习适合数据的模型。本文提供了一个适用于极大似然估计的两阶段主动学习算法和标签需求的上限和下限分析，并表明这种方法在一些情况下可以实现近乎最优的性能。

Jun, 2015

隐含层次和多组学习的简单近似最优算法

本论文研究了多组学习问题的解决结构并提供了简单和近乎最优的算法，以解决子群体的条件风险与公平性问题。

Dec, 2021