基于高阶信念变化的通用多智能体认知规划器
本文介绍了一种基于声明式编程技术的多智能体认知情境下的推理问题的解决方案,即 PLATO(基于 ePistemic 多智能体 Answer Program 解决方案),利用自定义认知状态表征和 ASP 求解器的效率,在从文献中收集的基准测试中取得了有竞争力的性能结果,并为其正确性开发了形式验证。
Aug, 2020
利用动态认知逻辑(DEL)的多代理规划在处理非确定性、部分可观察性和任意知识嵌套方面具有广泛应用的行动形式主义中,我们通过一种新颖的语义方法达到可决定性的目标。我们展示了该框架具有可决定的特性,并研究了其他扩展的交换公理以实现更复杂的 DEL 的决定性。
Jul, 2023
本篇论文提出了一种基于协调的认知预测和规划框架来解决多机器人系统中的非通信性渲染问题,同时实现了探索、覆盖、任务发现和完成以及汇合应用等任务,该框架通过基于前沿的方法在人工物理学框架内实现置信状态的传播和环境覆盖,经过模拟和实验验证了其有效性。
Feb, 2023
本文提出了一种基于动态认知逻辑 (DEL) 的新型算法,该算法限制了规划代理的推理深度为一个上界 b,以模态深度 b 为最多的高阶知识进行推理。算法利用了一种新型的 b-bisimulation 收缩确保了最小模型的唯一性。我们证明了深度有界规划算法是正确的。此外,我们证明了在推理深度的限制 b 内具有解决方案的规划任务的完备性(因此按照标准定义的迭代界限增加变体是完备的)。在推理深度的限制 b 下,该算法被证明是 (b + 1)-EXPTIME 完全,同时在代理和原子的数量上是固定参数可处理的。我们提供了算法的树搜索和图搜索变体,并将树搜索版本的实现与基准认知规划器进行了基准测试。
Jun, 2024
基于认识逻辑的合作代理研究中探讨了在没有共享模型的情况下,代理能够通过动态规划行动或交流来解决合作中的不一致。研究提出了一种在条件信念逻辑基础上扩展的形式化表示方法,用于显式地表示代理对可行计划和执行状态的嵌套信念,同时提供基于蒙特卡洛树搜索的在线执行算法,包括用于解释计划可行性、宣布意图和提问的通信行动,并通过评估算法的成功率和可扩展性证明,我们的代理能够更好地适应没有共享模型的团队合作。
Jul, 2023
本研究在部分可观察马尔可夫决策过程 (POMDPs) 的基础上,将代理模型纳入到状态空间中,使其扩展到了多智能体的情景下。代理人通过贝叶斯更新来维护对物理环境状态和其他代理模型的信念,并使用基于置信状态的映射来求得最优方案。虽然我们的方法中代理人的模型不可直接被操纵或观察,但我们证明了 POMDPs 的重要特性如收敛率、价值函数的分段线性和凸性等在我们的框架下仍然成立。
Sep, 2011
本文提出了一种新的方法解决并行多智能体规划问题,通过从并发多智能体规划编译到经典规划,利用现有的经典规划器解决原始多智能体问题,解决方案可直接解释为满足一组给定并发约束条件的并发计划,避免了并发操作带来的指数级膨胀问题,同时作为第一个处理受其他智能体行为有条件影响的行动效果的规划器,在理论上,我们证明了这种编译的音效和完备性;在实践中,我们展示了我们的编译器可以解决需要并行操作的具有挑战性的多智能体规划问题
Jun, 2019
用 DELPHIC 框架替代传统的 Kripke 模型,实现更紧凑的认知状态表示,并通过实验评估证实其在空间和时间上优于传统方法。
Jul, 2023
本文提出了基于范畴论概念的 C - 集合和双推出重写 (DPO) 的计划表示的一种替代方法,其可以有效处理支持所有层次域抽象的关于世界状态的结构化知识,提供了使用知识图谱和关系型数据库对世界状态和计划更新建模的形式语义,相较于经典规划表示,在处理隐含前提和效果上具有优越性,提供了一种更有结构的框架来建模和解决规划问题。
May, 2023
研究了基于信念空间规划的在线决策问题,在信息收集等场景下,介绍了一种自适应的方法来寻求最大可行回报,应用这种方法可以在保证准确率的前提下显著加速在线决策过程,并进行了大量现实模拟来验证此方法的优越性。
Feb, 2023