基于 PDFA 的高效主动学习

Jun, 2022

Towards Efficient Active Learning of PDFA

Franz Mayr, Sergio Yovine, Federico Pan, Nicolas Basset, Thao Dang

TL;DR我们提出了一种基于状态相似性、量化和基于树的数据结构的 PDFA 主动学习算法，并通过实验证明了其性能显著优于参考实现。

Abstract

We propose a new active learning algorithm for pdfa based on three main aspects: a congruence over states which takes into account next-sy

active learning pdfa congruence quantization tree-based data structure

发现论文，激发创造

使用查询和反例学习确定性加权自动机

该研究介绍了一种从黑盒语言模型中提取概率确定有限自动机（PDFA）的算法，并在应用于循环神经网络（RNN）时，通常比从同一网络中提取加权有限自动机（WFA）的谱提取法实现更好的单词错误率（WER）和标准化分布累计收益（NDCG）。

Oct, 2019

基于字符串概率查询的 PDFA 蒸馏

本研究提出了一种从神经网络中提取 PDFA 的算法，并展示了其在解释性机器学习领域的有效性。

Jun, 2024

高斯过程状态空间模型中的主动学习

本文研究了高斯过程状态空间模型的主动学习。通过决定其输入，我们可以通过 GPSSM 最优地学习系统的潜在状态，以便选择最具信息量的输入。我们提出了两种逼近潜在状态下 GPSSM 的互信息的方法，并在多个物理系统中进行了评估。

Jul, 2021

主动学习高斯过程动力学

本文提出了利用高斯过程回归中自然产生的信息理论特性的主动学习策略，尊重系统动态 imposed 约束下的抽样过程，并在高不确定度区域选择抽样点，以实现探索性行为和数据高效训练。该方法在大量数值基准测试中得到验证。

Nov, 2019

噪声容忍和差分隐私的统计主动学习算法

提出一种基于统计学习框架的主动学习算法，能够高效地处理随机分类噪声和差分隐私，且可将其转换为能容忍分类噪声的主动学习算法，同时也实现了用指数级别的误差提高标签节约的差分隐私主动学习算法.

Jul, 2013

高斯过程状态空间模型本地主动学习

本文提出了一种基于高斯过程状态空间模型的主动学习策略，旨在获取状态操作空间有界子集上的准确模型，并通过模型预测控制集成探索过程中收集的信息和自适应改进探索策略。

May, 2020

主动自适应的序列学习

提出了一种主动和自适应地解决一系列机器学习问题的框架，该框架通过使用一些未标记数据池中的最具信息量的样本，利用先前步骤中获得的信息，使用基于随机梯度下降的主动学习算法来实现近乎最优的风险性能，并构建了一个学习问题变化的估计器，通过使用主动学习样本提供一种自适应的样本大小选择规则，以保证足够的时间步数时超额风险是有界的。

May, 2018

计算高效的主动学习

通过简单而有效的方法不仅可以降低主动学习过程的计算成本，还能保持模型性能，从而优化大规模数据集的标注效率。

Jan, 2024

基于图的高效主动学习，采用概率似然的 Probit 近似

该研究介绍了如何在非高斯贝叶斯模型下对基于图的半监督学习 (SSL) 进行主动学习的新型适应方法，包括适用于非高斯分布的新型收集方法和模型重训练。

Jul, 2020

高效简约迁移主动学习

本文提出一种基于新的优化问题的主动学习算法，在流式环境下，可有效地解决任何分类器表示和分类问题，且具有高效实现的特点，并证明了该算法比现有的所有满足前两个特点的算法更为优秀，并对所有高效的主动学习算法进行了第一次实验分析，评估了它们在不同场景下的优劣。

Jun, 2015