学习产品自动机
我们提出了一种主动自动机学习算法,它基于将个别输出进行投影从而学习一个有限状态机的分解。这与 Labbaf 等人 (2023) 提出的最近的组合学习算法互为对偶。当将输出投影到一个较小的集合时,模型本身也会缩小。通过有几个这样的投影,我们不会丢失任何信息,完整的系统可以被重建。根据系统的结构,这大大减少了查询的数量,如算法的初步评估所示。
May, 2024
我们综述了近期人工智能领域中积极学习算法的研究现状,并提出了一种基于马尔可夫模型的形式化方法来组织该领域的研究。我们将提出的形式化方法应用于数据集增强,奖励更新等积极学习过程的元状态转移,以及针对其它方面如何适应形式化方法。
Jun, 2023
提出了一个将成员标签和成对偏好结合起来的新框架,扩展了主动规范学习的方法,以更灵活地进行活跃规范学习,通过两种模式的学习使我们能够鲁棒且方便地识别成员标签和偏好的规范。
Jul, 2023
该论文提出了一种从代理环境经验中学习非马尔可夫任务规范的新方法,可以将任务拆分为其构成子任务,提高了 RL 代理后续合成最优策略的速率,并提供了一个可解释的编码高级环境和任务特征的方式。
Aug, 2022
我们引入了一种模型,通过元学习来学习主动学习算法,它可以联合学习相关任务的数据表示、物品选择启发式和从标记训练集构造预测函数的方法。使用 Omniglot 和 MovieLens 数据集,在合成和实际环境中测试了我们的模型。
Jul, 2017
通过机器学习方法学习大规模优化问题的分解式解决方法,从而在计算时间上实现最优初始化,进而用于解决混合整数模型预测控制问题,结果表明该方法能显著减少解决时间并减少所需数据。
Oct, 2023
主题:主动自动机学习;适应性学习;状态匹配;参考模型;样本复杂度;摘要:本文介绍了一种自动学习的新框架,它通过状态匹配提供了对参考模型结构的灵活使用,从而减少了自动学习的样本复杂度。实证评估表明,该适应性学习框架改进了当前的状态艺术水平约两个数量级。
Jun, 2024
这篇论文提出了一种通用的学习框架,用于终身学习功能本质组合结构,分别研究了有监督学习和强化学习的应用,同时拓展到了非静态环境下。在评估实验中,展示了这种框架的优越性,取得了较好的效果。
Jul, 2022
介绍了一个交互式版本的基于证据驱动的状态合并算法(EDSM)用于学习有限状态自动机的变体,该算法可通过与人直接交互更好地利用领域知识。
Jul, 2017