Nov, 2024

通过神经符号归纳模仿学习实现长时间规划

TL;DR本研究针对现有模仿学习方法在开放环境中处理长时间任务的不足,提出了一种新颖的框架——归纳模仿学习(ABIL),结合数据驱动学习与符号推理的优势。研究表明,ABIL在长时间任务中显示出显著的数据效率和泛化能力,为符号规划提供了新的思路。