主动查询的马尔科夫形式
提出了一个将成员标签和成对偏好结合起来的新框架,扩展了主动规范学习的方法,以更灵活地进行活跃规范学习,通过两种模式的学习使我们能够鲁棒且方便地识别成员标签和偏好的规范。
Jul, 2023
本文研究了高斯过程状态空间模型的主动学习。通过决定其输入,我们可以通过 GPSSM 最优地学习系统的潜在状态,以便选择最具信息量的输入。我们提出了两种逼近潜在状态下 GPSSM 的互信息的方法,并在多个物理系统中进行了评估。
Jul, 2021
本文探讨应用自动机学习算法对基于模型验证的关键信息进行提取,实现对物理系统的建模,并基于主动学习和 Baum-Welch 算法对马尔可夫决策过程和马尔可夫链进行学习,最终证明了该种方法可以显著减少建模所需的观测次数。
Oct, 2021
本研究提出了一种新的统一原理来实现信息寻求和奖励最大化,将主动推理与强化学习结合起来,不仅解决了各自的局限性,同时还具有超越传统方法的探索新颖奖励的性能。
Dec, 2022
本文介绍适用于学习 Moore 机的主动学习算法的优化方法,其中输出包括多个可观测量,并通过投影分解为较小的组件进行学习,这对于学习软件尤为重要,因为组合方法对于保证可扩展性非常重要。
May, 2017
该论文研究了主动学习中困难的预测模型选择问题,并提出一种基于模型探针(model probes)的方法 Biased-Robin Algorithm,能够在相同成本和先验概率下有效地选择模型。
Jul, 2012
该论文研究了基于自由能原理的主动推理对机器学习中的强化学习和示范学习问题的解决,并将此概念应用于标准问题山车问题,结果表明主动推理可以涵盖强化学习和示范学习技术。
Apr, 2019
提出了一种基于 Wasserstein 距离的深度批量主动学习的统一且原则性的方法,其中包括通过替代优化来优化深度神经网络参数和批处理查询选择的理论分析,以及指示查询批处理选择中明确的不确定性 - 多样性权衡的原则,最终在不同的基准测试中评估了所提出的方法,并与基线相比,展现出更好的性能和更好的时间效率。
Nov, 2019