逻辑回归主动学习的基准和比较
本文提出了一种可靠和可扩展的实现来重新评估现有主动学习策略的数据集,通过重新评估实验,我们不仅纠正了现有基准测试中的配置错误,还揭示了模型兼容性等问题。我们经验突出了把研究努力奉献给重新评估现有基准测试以产生更可信结果和深入洞察的重要性。
Jun, 2023
探究主动学习在什么情况下有效,经验和理论都表明,主动学习的数据效率与最终分类器的错误率存在强烈的反比关系,理论上,对于不确定性采样的一种变体,渐进数据效率在极限分类器的倒数误差率的常数因子范围内。
Jun, 2018
该研究提出了一种基于回归分类框架的流式主动学习方法,通过将回归问题转化为分类问题,实现了对回归问题的流式主动学习,从而在相同的注释成本下提高了回归准确性。
Sep, 2023
本研究开发了一种基于支持向量分类的基础池式主动学习器的快速简单的实践方法,旨在解决很少标记数据点的情况下进行模型选择的挑战,并通过加权方法让模型在易于分类数据集和难以分类数据集之间取得平衡的最佳性能。
Dec, 2021
本文研究了如何在不可靠的情况下评估主动学习算法在训练期间的性能,并提出了三个主要挑战:如何推导性能分布,如何保留标记子集的代表性,以及如何纠正由于智能选择策略而引起的抽样偏差。
Jan, 2019
本文研究了主题 “主动学习”,发现尽管在特定模型和特定领域中使用主动学习可能会带来好处,但在不同模型和任务之间泛化当前方法的好处不可靠,并且主动学习的认购数据与指导其获取的模型相结合,与使用独立同分布的(I.I.D)随机样本训练继任模型的方法相比并没有明显的优势,主动学习的局限性是否值得现实中的应用,值得深思。
Jul, 2018
该论文研究了主动学习中困难的预测模型选择问题,并提出一种基于模型探针(model probes)的方法 Biased-Robin Algorithm,能够在相同成本和先验概率下有效地选择模型。
Jul, 2012
本文介绍了有监督学习中获取标记数据的高成本和获取大量未标记数据的轻松方法,以及通过自适应选择标记样本来获得高精度预测模型的主要问题设置和最近的研究趋势。重点介绍了选择从数据中进行标记的学习获取函数的研究、关于主动学习算法的理论工作和顺序数据获取的停止标准。介绍了材料开发和测量的应用示例。
Dec, 2020