该研究介绍了一种从黑盒语言模型中提取概率确定有限自动机(PDFA)的算法,并在应用于循环神经网络(RNN)时,通常比从同一网络中提取加权有限自动机(WFA)的谱提取法实现更好的单词错误率(WER)和标准化分布累计收益(NDCG)。
Oct, 2019
本研究提出了一种从神经网络中提取 PDFA 的算法,并展示了其在解释性机器学习领域的有效性。
Jun, 2024
本文研究了高斯过程状态空间模型的主动学习。通过决定其输入,我们可以通过 GPSSM 最优地学习系统的潜在状态,以便选择最具信息量的输入。我们提出了两种逼近潜在状态下 GPSSM 的互信息的方法,并在多个物理系统中进行了评估。
Jul, 2021
本文提出了利用高斯过程回归中自然产生的信息理论特性的主动学习策略,尊重系统动态 imposed 约束下的抽样过程,并在高不确定度区域选择抽样点,以实现探索性行为和数据高效训练。该方法在大量数值基准测试中得到验证。
Nov, 2019
提出一种基于统计学习框架的主动学习算法,能够高效地处理随机分类噪声和差分隐私,且可将其转换为能容忍分类噪声的主动学习算法,同时也实现了用指数级别的误差提高标签节约的差分隐私主动学习算法.
Jul, 2013
本文提出了一种基于高斯过程状态空间模型的主动学习策略,旨在获取状态操作空间有界子集上的准确模型,并通过模型预测控制集成探索过程中收集的信息和自适应改进探索策略。
May, 2020
提出了一种主动和自适应地解决一系列机器学习问题的框架,该框架通过使用一些未标记数据池中的最具信息量的样本,利用先前步骤中获得的信息,使用基于随机梯度下降的主动学习算法来实现近乎最优的风险性能,并构建了一个学习问题变化的估计器,通过使用主动学习样本提供一种自适应的样本大小选择规则,以保证足够的时间步数时超额风险是有界的。
May, 2018
通过简单而有效的方法不仅可以降低主动学习过程的计算成本,还能保持模型性能,从而优化大规模数据集的标注效率。
Jan, 2024
该研究介绍了如何在非高斯贝叶斯模型下 对基于图的半监督学习 (SSL) 进行主动学习的新型适应方法,包括适用于非高斯分布的新型收集方法和模型重训练。
Jul, 2020
本文提出一种基于新的优化问题的主动学习算法,在流式环境下,可有效地解决任何分类器表示和分类问题,且具有高效实现的特点,并证明了该算法比现有的所有满足前两个特点的算法更为优秀,并对所有高效的主动学习算法进行了第一次实验分析,评估了它们在不同场景下的优劣。
Jun, 2015