机会主义主动学习策略的学习
该论文提出了将主动学习重新表述为一种强化学习问题,并明确学习数据选择策略,其中策略充当主动学习启发式算法的角色,以解决启发式选择方法的有效性受限且性能因数据集而异的问题。我们使用跨语言命名实体识别来演示我们的方法,发现相对于传统的主动学习,我们的方法获得了均衡的改进。
Aug, 2017
使用元学习框架,将主动学习算法视为学习问题,并使用强化学习训练一个输入基础学习器状态和未标记点集的深度神经网络,预测下一个最佳注释点,使用多任务数据集嵌入方法,使得算法可以直接推广到不同的问题。
Jun, 2018
本文介绍了有监督学习中获取标记数据的高成本和获取大量未标记数据的轻松方法,以及通过自适应选择标记样本来获得高精度预测模型的主要问题设置和最近的研究趋势。重点介绍了选择从数据中进行标记的学习获取函数的研究、关于主动学习算法的理论工作和顺序数据获取的停止标准。介绍了材料开发和测量的应用示例。
Dec, 2020
基于池的主动学习方法对于增加机器学习模型的数据效率具有潜力,但现有方法对数据集和训练设置选择非常敏感,因此不适用于一般应用。为了解决这个问题,学习主动学习(LAL)领域建议学习主动学习策略本身,使其能够适应特定的设置。本研究提出了一种基于关注条件神经过程模型的用于分类的新型 LAL 方法,利用主动学习问题的对称性和独立性属性。我们的方法基于从一个近视的预测模型进行学习,使得我们的模型能够适应非标准目标,如不平等权重的错误。我们的实验证明,在这些设置下,我们的神经过程模型优于多种基线方法。最后,我们的实验表明,我们的模型对于不同数据集的稳定性有所提高。然而,分类器的选择会对性能产生影响,还需要更多的工作来减小与近视预测模型的性能差距,并提高可伸缩性。我们将我们的工作作为对非标准目标的 LAL 的概念验证,并希望我们的分析和建模考虑能够为未来的 LAL 工作提供启发。
Sep, 2023
本文提出了一种基于混合密度网络的深度主动学习方法,该方法通过对定位和分类器的输出估计概率分布并明确估计模型的不确定性,使用一种特殊得分函数将这两种不确定性聚合在一起以获取每个图像的信息量分数,通过 PASCAL VOC 和 MS-COCO 数据集的实验证明了该方法在物体检测方面的有效性,性能优于单模型和多模型方法,而计算成本仅为之前方法的一小部分。
Mar, 2021
本研究结合活性学习和增量学习的方法,提出一种基于不确定度的适用于大多数对象检测器的主动学习度量标准,并探讨在样本选择过程中如何解决类别不平衡问题,通过系统评估在 PASCAL VOC 2012 数据集上,实现对新未标注数据集的持续探索。
Sep, 2018
本研究描述了一个可扩展的主动学习系统,旨在改善在自动驾驶中监督学习的数据效率,主要围绕深度神经网络、有监督学习、主动学习、自动驾驶和数据效率展开,同时探讨了一些挑战及其解决方法,并简要描述了未来发展方向。
Apr, 2020
我们引入了一种模型,通过元学习来学习主动学习算法,它可以联合学习相关任务的数据表示、物品选择启发式和从标记训练集构造预测函数的方法。使用 Omniglot 和 MovieLens 数据集,在合成和实际环境中测试了我们的模型。
Jul, 2017
本文研究了主题 “主动学习”,发现尽管在特定模型和特定领域中使用主动学习可能会带来好处,但在不同模型和任务之间泛化当前方法的好处不可靠,并且主动学习的认购数据与指导其获取的模型相结合,与使用独立同分布的(I.I.D)随机样本训练继任模型的方法相比并没有明显的优势,主动学习的局限性是否值得现实中的应用,值得深思。
Jul, 2018
该论文研究了主动学习中困难的预测模型选择问题,并提出一种基于模型探针(model probes)的方法 Biased-Robin Algorithm,能够在相同成本和先验概率下有效地选择模型。
Jul, 2012