May, 2023

基于模仿学习的算法,用于在现代电力市场中实现先验知识转移,用于贝叶斯纳什均衡估计

TL;DR提出了一种 Bayesian Nash Equilibrium 策略来优化标的策略,利用 Bayes-adaptive Markov Decision Process in FEM(BAMDP-FEM)将先验知识考虑在内,同时使用 Multi-Agent Generative Adversarial Imitation Learning 算法(MAGAIL-FEM) 来进行多智能体学习和近似求解。在案例研究中,本文提出的算法相对于传统方法收敛速度更快,得到的 Nash 平衡更准确。