IJCAIMay, 2024
马尔可夫决策过程下基于分布式避障特性的认证策略验证与合成
Certified Policy Verification and Synthesis for MDPs under Distributional Reach-avoidance Properties
S. Akshay, Krishnendu Chatterjee, Tobias Meggendorfer, Đorđe Žikelić
TL;DR该研究论文介绍了以马尔可夫决策过程为基础的状态转换模型及其在控制器验证和综合方面的应用,特别是在分布到达 - 避免规范下的证书合成问题,并提出了自动化方法来合成证书和策略以及验证其正确性。