STRIPS 行动发现
本文提出了一种新颖的方法,该方法从示例中学习 STRIPS 行动模型,并将其编译为一个经典的规划任务。编译方法对可用输入知识的不同量具有灵活性,并且可以接受部分指定的行动模型,并且可以用于验证计划执行的观察是否遵循给定的 STRIPS 行动模型,即使该模型不是完全指定。
Mar, 2019
通过学习状态轨迹开始,本文探索了在未提供学习动作参数时的学习情况,定义了两个追踪质量级别,并提出了相应的算法。实验评估表明,提出的算法相对于现有的学习工具 FAMA,速度更快,可以处理更大的输入,并提供更接近参考模型的学习动作模型。
Feb, 2024
本文研究如何使智能代理能够在真实环境中自主行动,提出一种通过学习状态转换函数从而得到明确的 STRIPS 规则的方法,能够应对真实环境中嘈杂的或不完全的观察数据。模拟实验表明该方法能够学习有用的环境模型描述。
Oct, 2012
该论文介绍了如何使用 STIRPS 操作表示语言来实现多个执行器的代理计划生成,通过小的修改可以实现交互作用的并发操作,通过开发一个名为 POMP 的部分排序规划器,可以扩展现有的部分排序规划器来进行计划。
Jun, 2011
本文探讨了当无完整符号化模型可用时,如何使用 STRIPS 模型来改进基于机器学习的黑盒计划。我们的研究表明,这是一种提高黑盒计划效率的有效方式,超越了收集更多数据或调整机器学习架构。
Jul, 2022
本文介绍了一种自主学习的方法,通过无标注的高维真实值机器人轨迹,自动学习抽象状态和动作的可推广的基于逻辑的关系表示,形成了自动发明的类似 PDDL 的领域模型。通过确定性设置的实证结果表明,仅凭少量机器人轨迹就可以学习到强大的抽象表示,所学的关系表示包括但超越了高级动作的经典直观概念,并且学习的模型使得规划算法能够扩展到以前超出手工构思抽象的任务范围。
Feb, 2024
本文提出了一种基于 MAX-SAT 框架的方法,用于自动学习规划系统的领域模型,通过输入一组含有无序动作和噪声的计划迹线来输出最佳的动作模型,并通过系统实证评估证明了该方法的有效性
Aug, 2019
该论文提出了一个学习状态和动作抽象的框架,利用带有语言注释的示范数据来自动发现符号化和抽象化的动作空间,并在此基础上引出一个潜在的状态抽象。框架包括三个阶段:恢复对象级和动作概念,学习状态抽象、抽象动作的可行性和转移模型,以及对抽象动作应用低级策略。在推断过程中,框架首先根据潜在的转移和可行性函数制定抽象动作计划,然后利用低级策略优化高级计划。该框架可以泛化到涉及新颖对象实例和环境、未见过的概念组合以及需要较长规划范围的任务场景中。
May, 2024