Feb, 2024

神经符号方法在可解释性和概率决策中的多智能体强化学习

TL;DR多智能体强化学习(MARL)在优化多智能体共享资源中的系统性能方面具有潜力,但常见的深度学习MARL解决方案在真实世界问题中存在可解释性、样本效率、部分可观察性等问题。为了解决这些挑战,我们提出了一种基于事件驱动的公式,利用神经符号方法处理分布式协作MARL智能体的决策制定。我们还开发了一种新颖的概率神经符号框架,概率逻辑神经网络(PLNN),将逻辑推理能力与概率图模型相结合,以实现在不确定性和部分可观察性下的决策制定。我们通过解决片上系统中的功率共享问题来展示我们的研究成果。