非局部非追溯性主动搜索的摊销深度模拟学习

May, 2024

非局部非追溯性主动搜索的摊销深度模拟学习

Amortized nonmyopic active search via deep imitation learning

Quan Nguyen, Anindya Sarkar, Roman Garnett

TL;DR通过训练神经网络学习搜索的策略，我们研究了在稀缺、有价值类别中进行主动搜索的问题，并使用模仿学习技术模拟专家的策略，实现了具有竞争性性能的低成本搜索策略。

Abstract

active search formalizes a specialized active learning setting where the goal is to collect members of a rare, valuable class. The state-of-the-art algorithm approximates the optimal bayesian policy in a budget-a

active search rare class bayesian policy computational complexity imitation learning

发现论文，激发创造

非眼力学的多保真主动搜索

该研究提出了一种适用于多样性主动搜索的模型，该模型基于计算机仿真技术，开发了一种新颖的节约预算的策略，能够在探索和利用之间动态平衡，并在真实世界数据集上取得了明显的改进。

Jun, 2021

主动模型选择

该论文研究了主动学习中困难的预测模型选择问题，并提出一种基于模型探针（model probes）的方法 Biased-Robin Algorithm，能够在相同成本和先验概率下有效地选择模型。

Jul, 2012

贝叶斯最优主动搜索与调查

采用贝叶斯决策理论，通过选择自然效用函数，我们派生了两个活动二分类问题的最优策略，包括主动搜索和主动调查，并通过一项新颖的理论结果，证明了较少缺乏远见的近似可以超过任意程度的较多远见的近似，并推导出对于某些模型的边界，允许我们在仍然确保做出最优决策的情况下，减少（在实践中极大地）朴素实现最优策略所需的指数搜索空间，从而实现更多前瞻性。

Jun, 2012

组合优化问题的高效主动搜索

本文介绍了三种高效的主动搜索策略，通过改变模型的一部分参数进行一定的参数优化，从而有效地解决机器学习中的组合优化问题。

Jun, 2021

迭代式摊销策略优化

该研究探讨利用策略网络进行连续控制的深度强化学习算法中的保险网络，并提出了迭代的摊销优化技术来提高性能。

Oct, 2020

带有噪声引导的主动模仿学习

LEAQI 算法利用差异分类器在序列标注任务中替代了昂贵、低效的查询过程，实现了更好的查询效果和准确度。

May, 2020

基于深度强化学习的分摊主动因果归纳

Causal Amortized Active Structure Learning (CAASL) is a policy that selects adaptive interventions using a transformer-based network trained with reinforcement learning, resulting in a better estimate of the causal graph.

May, 2024

深度主动学习：现实检验

通过全面评估当前最先进的深度主动学习方法，我们的研究发现在一般情况下没有单一模型的方法能显著超越基于熵的主动学习方法，甚至一些方法还不如随机抽样。我们深入研究了常常被忽视的方面，如初始预算、预算递增步长和预训练的影响，并揭示了它们在实现卓越结果上的重要性。此外，我们还将评估拓展到其他任务，探索了将主动学习与半监督学习和目标检测相结合的有效性。我们的实验提供了有价值的见解和具体建议，为未来的主动学习研究做出了贡献。通过揭示当前方法的局限性，并理解不同实验设置的影响，我们旨在启发在有限注释预算的现实场景下更高效地训练深度学习模型。这项工作有助于提高主动学习在深度学习中的效果，并使研究人员在应用主动学习时能做出明智的决策。

Mar, 2024

无模型模仿学习与策略优化

在模仿学习中，我们使用基于样本的方法开发了一种基于策略梯度的算法，即通过学习专家的样本轨迹，找到至少与专家策略一样好的参数化随机策略；该算法可以应用于高维度环境，并保证收敛到局部最小值。

May, 2016

主动信息获取

该论文提出了动态信息获取策略及如何在学习搜索框架下实现，应用于情感分析和图像识别等任务，得到了很好的统计性能，同时有潜在的特点是关注实例的突出部分和较难部分。

Feb, 2016