主动模型选择
本研究开发了一种基于支持向量分类的基础池式主动学习器的快速简单的实践方法,旨在解决很少标记数据点的情况下进行模型选择的挑战,并通过加权方法让模型在易于分类数据集和难以分类数据集之间取得平衡的最佳性能。
Dec, 2021
本文介绍了有监督学习中获取标记数据的高成本和获取大量未标记数据的轻松方法,以及通过自适应选择标记样本来获得高精度预测模型的主要问题设置和最近的研究趋势。重点介绍了选择从数据中进行标记的学习获取函数的研究、关于主动学习算法的理论工作和顺序数据获取的停止标准。介绍了材料开发和测量的应用示例。
Dec, 2020
本文研究了主题 “主动学习”,发现尽管在特定模型和特定领域中使用主动学习可能会带来好处,但在不同模型和任务之间泛化当前方法的好处不可靠,并且主动学习的认购数据与指导其获取的模型相结合,与使用独立同分布的(I.I.D)随机样本训练继任模型的方法相比并没有明显的优势,主动学习的局限性是否值得现实中的应用,值得深思。
Jul, 2018
提出了一种能够在只有单类样本和无标签数据的情况下运作的主动学习算法,该方法通过分别估计正样本和未标记点的概率密度,计算信息性的期望值以获取更好的信息性度量。与其他类似方法相比,实验和经验分析结果表现出有前途的结果。
Feb, 2016
该论文提出了将主动学习重新表述为一种强化学习问题,并明确学习数据选择策略,其中策略充当主动学习启发式算法的角色,以解决启发式选择方法的有效性受限且性能因数据集而异的问题。我们使用跨语言命名实体识别来演示我们的方法,发现相对于传统的主动学习,我们的方法获得了均衡的改进。
Aug, 2017
该论文介绍了一个新的方法,通过将采集函数作为学习预测器并通过强化反馈训练它,以打破模型选择中的恶性循环;该系统由贝叶斯神经网络、自举采集函数、概率状态定义和另一个贝叶斯策略网络组成,可在三个基准数据集上始终发现新的更好的采集函数。
Jun, 2019
主要介绍了主动学习策略在解决二分类问题中的应用,提出了一种基于偏移正态分布采样函数的方法,通过限制噪声和正类标签选择,提高了 20% 到 32% 的成本效率。
Mar, 2024
本文探讨使用预训练模型进行主动学习任务中的歧义消除,发现预训练模型使用基于不确定性的主动学习时所需标注数量降低至非预训练模型的五分之一,并且可以通过在预训练的表示空间中选择具有消除歧义的特征属性的数据样本来获得这种性能提升。
Apr, 2022