- 语言模型可以从环境反馈中推断经典计划器的动作语义
提出使用经典规划和大型语言模型共同实施领域归纳、学习和验证动作的前后条件,利用 LLM 推理来启发性地完成经典规划器发出的部分计划,并根据执行后的环境反馈用逻辑语言推断领域的语义规则。通过对 7 个环境的分析表明,使用 LLMs 作为启发性 - 极值蒙特卡洛树搜索
在本文中,我们进一步深入研究了计划任务中使用的理想赌博机,并提出了两种赌博机 UCB1-Uniform/Power,然后将它们应用于传统计划的 MCTS 中,我们正式证明了它们的遗憾界限,并在传统计划中实证展示了它们的性能。
- 将 LAMA 与最佳优先宽度搜索相结合
如何将最成功的 BFWS 与经典规划器 LAMA 相结合,我们研究表明,将 BFWS 中强大的 open-list 直接添加到 LAMA 中会降低其性能,但将两者的部分特征相结合却能产生一种新的最先进的敏捷规划器。
- 关于 Stackelberg 规划和元操作验证的计算复杂性研究:技术报告
Stackelberg 计划是一个最近引入的单回合两个玩家对抗性规划模型,目标是第一个玩家阻碍第二个玩家实现目标。这个问题位于古典规划和组合式两个玩家游戏之间。通过对 Stackelberg 计划的第一个理论复杂性分析,我们发现通常情况下 - TwoStep:基于经典规划器和大型语言模型的多智能体任务规划
通过结合经典规划和大型语言模型的优势,我们实现了基于 LLMs 的目标分解,提高了计划的速度和执行成功,并且比单一代理计划少了更少的执行步骤,同时实现了与人类专家指定的多代理执行步骤类似的结果。
- TIC:使用 LLMs 和逻辑中间表示进行准确的‘文本到计划’的翻译 - 推断 - 编译
我们研究了生成给定自然语言规划任务请求的计划的问题。我们利用了自然语言处理和经典规划工具的优势通过使用 LLM 生成规划任务请求的 PDDL 表示,并使用经典规划器计算计划。我们的方法包括使用 LLM 生成自然语言任务描述的逻辑可解释中间表 - 具有惰性约束生成求解器的层次顺序规划
本文就基于惰性子句生成算法的约束编程方法在解决经典顺序规划方面的可能性进行了探讨,提出了一种基于提升因果编码的约束规划模型,展示了惰性子句生成算法的潜力来扩展可行的规划推断方法,并通过实验证明了我们的方法在解决需要更少计划步数的规划问题方面 - 使用神经网络学习特定搜索空间启发式算法
建议并评估了一种系统,该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器,并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。
- 经典规划中基于尺度自适应的探索与利用平衡
提出了一种基于 UCB1-Normal 赌博机算法的 MCTS / THTS(Monte Carlo Tree Search / Trial Based Heuristic Tree Search)算法,该算法可以处理具有不同尺度的奖励分布 - 量子电路的最优布局综合作为经典规划
该研究提供两种编码方案用于量子电路中最优布局综合的经典规划问题,并利用经典规划器综合出针对一系列基准测试的最优布局。
- 自动计划的重构技术:一项系统性综述
该论文对经典规划的重组技术的大量研究进行了系统综述,旨在提供该领域的整体视图,并促进未来的研究。作为一个有形的结果,我们提供了现有技术分类的定性比较,这可以帮助研究人员获得它们的优点和缺点的概述。
- 从前像样本中学习启发式函数以进行古典规划
本文提出了一种基于回归的监督学习算法 (RSL),用于学习每个实例的神经网络定义的启发式函数,以解决经典计划问题,并证明了它在覆盖率和训练时间方面优于以前的计划启发式功能。
- 符号搜索与表达式扩展的最优规划
在经典计划中,为了满足智能体的目标,目标是制定一系列行动方案。扩展规划是用于捕获和模拟不同类型的推理问题的一种表达方式。本文中,我们提出使用符号搜索进行成本最优规划,为经典计划的不同表达扩展,包括公理、状态依赖性操作成本、过度订阅计划和前 - AAAI地标提取算法对基于地标的目标识别效果的评估
探讨了使用多种不同的地标提取算法在目标和计划识别上的影响和效果,发现提取更多的地标并不一定能提高目标识别的精度和减小误差。
- 稀疏图形记忆用于鲁棒规划
该论文介绍了 Sparse Graphical Memory (SGM) 的新数据结构,与深度学习和经典规划相结合,以实现用于长时间范围下稀疏奖励视觉导航任务的可扩展性表现优于当前领先的方法。
- AAAISTRIPS 行动发现
本文提出一种新算法来无监督地合成 STRIPS 动作模型,并通过多种实验表明所学习的动作模型可以泛化到未见过的规划实例。
- AAAI使用并发条件效应解决多智体规划问题
本文提出了一种新的方法解决并行多智能体规划问题,通过从并发多智能体规划编译到经典规划,利用现有的经典规划器解决原始多智能体问题,解决方案可直接解释为满足一组给定并发约束条件的并发计划,避免了并发操作带来的指数级膨胀问题,同时作为第一个处理受 - 使用古典规划学习 STRIPS 动作模型
本文提出了一种新颖的方法,该方法从示例中学习 STRIPS 行动模型,并将其编译为一个经典的规划任务。编译方法对可用输入知识的不同量具有灵活性,并且可以接受部分指定的行动模型,并且可以用于验证计划执行的观察是否遵循给定的 STRIPS 行动