Feb, 2024

由实际到逻辑再到实践:从原始数据中创造符号词汇、行动和模型的规划方法

TL;DR本文介绍了一种自主学习的方法,通过无标注的高维真实值机器人轨迹,自动学习抽象状态和动作的可推广的基于逻辑的关系表示,形成了自动发明的类似 PDDL 的领域模型。通过确定性设置的实证结果表明,仅凭少量机器人轨迹就可以学习到强大的抽象表示,所学的关系表示包括但超越了高级动作的经典直观概念,并且学习的模型使得规划算法能够扩展到以前超出手工构思抽象的任务范围。