FIRAL:用于多项逻辑回归的主动学习算法
本文提出了一个受多臂老虎机启发的池化主动学习算法,通过精心构造主动学习和多臂老虎机之间的类比,利用多臂老虎机文献中的下限置信度和自协调正则化等思想来设计我们提出的算法。我们的算法是一个顺序算法,在每一轮中,将池上的一个采样分布分配在上面,从这个分布中采样一个点,并查询标签。我们的采样分布的设计也受到了主动学习和多臂老虎机之间类比的启发。我们展示了如何推导算法所需的下限置信度。实验比较表明,在一些标准的UCI数据集上,与先前提出的主动学习算法相比,我们的算法具有更好的性能。
Sep, 2013
通过交互查询子集示例的标签,主动学习器在模型类和大量未标记示例的情况下学习适合数据的模型。本文提供了一个适用于极大似然估计的两阶段主动学习算法和标签需求的上限和下限分析,并表明这种方法在一些情况下可以实现近乎最优的性能。
Jun, 2015
本研究提供了一种理论框架,分析了现有基于Fisher信息比率 (FIR) 的主动学习方法,并表明FIR可以渐近地被视为对数似然比的预期方差的上界,同时提出了一种更加统一的框架用于理论比较和开发基于该目标的新型主动学习方法。
May, 2016
本文介绍了最常用的分类器之一-逻辑回归的主要应用和性能,比较了不同的主动学习方法在准确性和计算成本方面的表现,并且发现最简单和最早期的主动学习方法-不确定性采样,表现优越。
Nov, 2016
提出了一种新的主动学习方法 MVAL,通过评估下一个待查询样本和其潜在标记的变化引起的输出变量的变化率来测量未标记实例的价值,并利用信息矩阵来跟踪这些输出分数,通过融合方差来选择既具有信息性又代表性的示例。与逻辑回归和支持向量机相结合,表现出与同类算法相比的最先进性能。
Jun, 2017
该研究通过结合生成模型和变分自编码器(Variational Auto Encoder)来考虑分类样本的不均衡分布,利用贝叶斯思想中的三个关键因素,显著提高已有方法在有限数据预算下的性能。
Mar, 2020
我们研究了多类别分类中的学习与弃权的关键框架,介绍了一系列新的理论和算法结果,提出了几个新的代理损失函数家族,并分析了单阶段和两阶段学习设置的保证和应用,证明了我们的代理损失的优越性,并展示了广泛适用的两阶段弃权算法的卓越性能。
Oct, 2023
AnchorAL是一种针对不平衡分类任务的主动学习方法,通过选择类特定的样本作为锚点,并从未标记数据池中获取最相似的样本来构建子池,从而解决了大型数据池上传统基于池的主动学习的计算复杂度高、准确率低的问题,并促进了对少数类实例的发现与类平衡。
Apr, 2024
使用包装器主动学习方法对分类问题进行改进,通过在初始标记样本上构建分类树,将空间分解为低熵区域,再使用基于输入空间的准则从这些区域中进行子采样,并证明了该方法在使用受限标记数据集时构建准确分类模型的有效性。
Apr, 2024
该研究解决了现有主动学习算法在面对大规模数据集时的可扩展性问题。通过提出一种近似算法,显著降低了存储和计算复杂度,并实现了在GPU上的并行实现。研究结果表明,该方法在多个数据集上的准确性与现有最先进算法相当,同时具备更好的扩展性。
Sep, 2024