发现通用主动学习策略

Oct, 2018

Discovering General-Purpose Active Learning Strategies

Ksenia Konyushkova, Raphael Sznitman, Pascal Fua

TL;DR该研究提出了一个通用的方法来发现可以从数据中转移的主动学习策略，通过将注释过程形式化为马尔可夫决策过程，设计出通用的状态和动作空间，并引入了一个新的奖励函数，该函数可以准确地模拟最小化注释成本的主动学习目标。然后，使用强化学习来寻找最优的主动学习策略，并在多个不相关的领域对学习后的策略进行了评估，表明它们始终优于现有技术基线。

Abstract

We propose a general-purpose approach to discovering active learning (AL) strategies from data. These strategies are transferable from one domain to another and can be used in conjunction with many machine learning models. To this end, we formalize the annotation process as a Markov de

active learning transferable strategies reinforcement learning annotation cost optimization

发现论文，激发创造

通过深度强化学习元学习可转移的主动学习策略

使用元学习框架，将主动学习算法视为学习问题，并使用强化学习训练一个输入基础学习器状态和未标记点集的深度神经网络，预测下一个最佳注释点，使用多任务数据集嵌入方法，使得算法可以直接推广到不同的问题。

Jun, 2018

部署主动学习的实际障碍

本文研究了主题 “主动学习”，发现尽管在特定模型和特定领域中使用主动学习可能会带来好处，但在不同模型和任务之间泛化当前方法的好处不可靠，并且主动学习的认购数据与指导其获取的模型相结合，与使用独立同分布的（I.I.D）随机样本训练继任模型的方法相比并没有明显的优势，主动学习的局限性是否值得现实中的应用，值得深思。

Jul, 2018

从数据中学习主动学习

本文提出了一种新的基于数据驱动的主动学习方法，该方法将问题选择过程描述为回归问题以学习基于以前经验的策略，具有广泛的适用性。

Mar, 2017

自然语言生成的主动学习

本文是第一次系统地研究了主动学习在文本生成方面的应用，研究表明现有的主动学习策略在文本生成场景下效果不佳，无法持续超越随机示例选择的基准线。

May, 2023

ALE：面向自然语言处理的基于仿真的主动学习评估框架用于参数驱动的查询策略比较

使用可复现的主动学习评估框架来比较评估自然语言处理中的主动学习策略，并通过定义和跟踪实验参数，帮助实践者作出更明智的决策，同时帮助研究者开发出新的高效主动学习策略和制定最佳实践，从而降低注释成本。

Aug, 2023

学习主动学习：深度强化学习方法

该论文提出了将主动学习重新表述为一种强化学习问题，并明确学习数据选择策略，其中策略充当主动学习启发式算法的角色，以解决启发式选择方法的有效性受限且性能因数据集而异的问题。我们使用跨语言命名实体识别来演示我们的方法，发现相对于传统的主动学习，我们的方法获得了均衡的改进。

Aug, 2017

学习针对特定学习目标的主动学习策略

基于池的主动学习方法对于增加机器学习模型的数据效率具有潜力，但现有方法对数据集和训练设置选择非常敏感，因此不适用于一般应用。为了解决这个问题，学习主动学习（LAL）领域建议学习主动学习策略本身，使其能够适应特定的设置。本研究提出了一种基于关注条件神经过程模型的用于分类的新型 LAL 方法，利用主动学习问题的对称性和独立性属性。我们的方法基于从一个近视的预测模型进行学习，使得我们的模型能够适应非标准目标，如不平等权重的错误。我们的实验证明，在这些设置下，我们的神经过程模型优于多种基线方法。最后，我们的实验表明，我们的模型对于不同数据集的稳定性有所提高。然而，分类器的选择会对性能产生影响，还需要更多的工作来减小与近视预测模型的性能差距，并提高可伸缩性。我们将我们的工作作为对非标准目标的 LAL 的概念验证，并希望我们的分析和建模考虑能够为未来的 LAL 工作提供启发。

Sep, 2023

ImitAL: 在合成数据上学习的主动学习策略

本文介绍了一种领域无关的主动学习（Active Learning）查询策略 ImitAL，使用学习排序（Learning-to-rank）方法编码 AL，通过大规模模拟运行在纯合成数据集上进行训练，成功地通过与其他 7 种查询策略在 13 个不同领域的数据集上的广泛评估。

Aug, 2022

自然语言处理中主动学习的调查

本文介绍了活跃学习在自然语言处理中的应用，并对查询策略、结构化预测任务、注释成本、模型学习和活跃学习的起止等关键问题进行了探讨。结论部分对相关主题和未来方向进行了讨论。

Oct, 2022

使用神经网络实现鲁棒性和可重现的主动学习

本研究旨在证明在相同实验条件下，不同类型的主动学习算法（基于不确定性、多样性和委员会的），与随机采样基准相比，产生的收益不一致，这种性能度量的差异性可能导致结果与以前报告的结果不一致，强正则化下，主动学习方法在各种实验条件下显示出微小或无优势，并提出一套关于如何评估主动学习算法的建议，以确保结果在实验条件变化下具有重复性和稳健性。

Feb, 2020