人类参与:基于证据驱动状态合并算法的交互式被动自动机学习
本文介绍机器学习领域的交互式学习方法,通过实验展示了如何使用人机交互的方式将黑箱算法变为透明的算法,以提高算法的可信度和接受度,并探讨了交互式学习方法在健康信息学领域中的应用和优势。
Aug, 2017
通过深度强化学习、自动化学习和马尔可夫决策过程等技术,学习出由自主智能体控制的环境模型,以解决复杂环境下的控制问题,并在多个强化学习基准环境中验证了方法的有效性。
Jun, 2023
本文介绍使用干预性策略学习的方法来解决机器人操作任务中必须经过精确定序的地方的问题,提出一种 6 自由度机器人操作任务的数据采集系统,并开发了一个简单而有效的算法来收集新数据以遍历通过这些难点,使用干预策略学习的代理在机器人的线路穿线任务和制造咖啡任务中的表现优于其他多种基线算法。
Dec, 2020
该论文提出了一种从代理环境经验中学习非马尔可夫任务规范的新方法,可以将任务拆分为其构成子任务,提高了 RL 代理后续合成最优策略的速率,并提供了一个可解释的编码高级环境和任务特征的方式。
Aug, 2022
本文研究了 Automaton 模型的可解释性问题,通过修改状态合并方法来学习变量的有限状态自动机,提出了关键特性的概念,进而应用于各类监督和无监督分类、聚类等涉及到顺序数据的问题。
Nov, 2016
主题:主动自动机学习;适应性学习;状态匹配;参考模型;样本复杂度;摘要:本文介绍了一种自动学习的新框架,它通过状态匹配提供了对参考模型结构的灵活使用,从而减少了自动学习的样本复杂度。实证评估表明,该适应性学习框架改进了当前的状态艺术水平约两个数量级。
Jun, 2024
该研究探讨了可解释人工智能技术在研究模型预测方面的应用,提出了一种数学近似方法,建立了人在回路中的查询策略和端到端工作流程的普遍形式化,从而使我们可以严格比较这种使用方法与标准主动学习算法的优劣,同时允许工作流程的扩展,并通过模拟来评估其实用价值,同时展示了一些初步的有前途的结果。
Jun, 2023
在生物医学环境中,为了从多个非同步进程中获取尽可能多的相关事件,需要计划和执行一种高效的获取范式。为了解决这个问题,本文提出了两种新的方法:基于人工智能的编码动态进程方法(EDP),以及基于机器学习运营的动态进程实验自动化流水线(EAPDP),它使用从 EDP 中提取的知识来高效地调度实践中的生物医学实验的获取过程。在第一个实验中,我们展示了预训练的最先进的目标分割方法 CPN 作为 EAPDP 的一个模块,从获取的三维图像堆栈中提取出 EDP 相关的对象。
Oct, 2023
本文研究了高斯过程状态空间模型的主动学习。通过决定其输入,我们可以通过 GPSSM 最优地学习系统的潜在状态,以便选择最具信息量的输入。我们提出了两种逼近潜在状态下 GPSSM 的互信息的方法,并在多个物理系统中进行了评估。
Jul, 2021