本文提出了一种通过联合执行主动特征查询和监督矩阵完成来训练有效分类模型的方法,以最小化获取成本,并同时降低误差和监督损失。此外,还提出了一种成本感知的活动选择双目标优化方法来选择不同获取成本的特征。该方法已通过理论分析和实验研究得到了有效验证。
Feb, 2018
本文提出了一种新的主动特征获取方法,使用 Lazy Model 和 Fisher scores 确定特征子集以在测试期间最大程度地提高预测性能同时最小化成本(即特征获取成本达到可接受的精度或预算限制),并在合成和实际数据集上进行了实验来证明其准确性和速度优势。
Jun, 2023
提出一种基于主动规划神经网络的在线决策树构建方法,利用自适应子模性来选择获取具有最小代价的特征值,通过后验采样算法降低在线预测误差,对各种现实世界中的数据集进行了广泛的实验,并在概念漂移的情况下展示其有效性和灵活性。
May, 2023
提供了一个新的框架,通过强化学习问题对活动特征获取问题进行建模,并引入了一种更系统完善的特征子集编码机制,该方法使用无序 LSTM-based 的集合编码机制来进行学习,从而在包含有缺失条目的情况下得到了很好的应用,并在活动特征获取方面性能均优于其他基线系统。
Sep, 2017
该论文介绍了一个新的方法,通过将采集函数作为学习预测器并通过强化反馈训练它,以打破模型选择中的恶性循环;该系统由贝叶斯神经网络、自举采集函数、概率状态定义和另一个贝叶斯策略网络组成,可在三个基准数据集上始终发现新的更好的采集函数。
Jun, 2019
本文提出了一种称为 NORA 的新方法,该方法利用高斯过程回归的嵌套采样并行生成近似排序的 Monte Carlo 样本,以有效生成排序一致的候选者批次,以及推断边际量。
在昂贵的多目标组合优化问题中,积极学习被越来越多地采用,但它涉及一个具有挑战性的子集选择问题,即优化批量采集评估的好坏量化指标。为了管理庞大的搜索空间,我们引入了一种新颖的贪婪式子集选择算法,通过基于贪婪策略的顺序贪婪采样,直接在组合空间上优化批量采集,以同时解决所有贪婪子问题。值得注意的是,我们在红色荧光蛋白设计任务上的实验证明,我们提出的方法在查询次数减少了 1.69 倍的情况下,实现了基准性能,显示出其高效性。
Jun, 2024
本研究提出一种基于贝叶斯批量主动学习方法来解决大规模监督模型中标签获取成本高的问题,从而利用大量未标记数据来改善模型性能。此方法通过逼近模型参数的完整数据后验概率,并使用随机投影技术来推广到任意模型,从而使批处理的数据选择更加多样,有效降低了计算复杂度,并在多个大规模回归和分类任务上得到了证实。
Aug, 2019
本研究提出利用混合专家与特征统计对齐方法,提高生成对抗网络在语言模型中的表示能力并改善生成数据的学习信号,从而在文本生成任务中取得了更优异的性能。
Feb, 2023
该论文提出了动态信息获取策略及如何在学习搜索框架下实现,应用于情感分析和图像识别等任务,得到了很好的统计性能,同时有潜在的特点是关注实例的突出部分和较难部分。
Feb, 2016