ICMLOct, 2021

使用 Baum-Welch 算法主动学习马尔可夫决策过程(扩展版)

TL;DR本文探讨应用自动机学习算法对基于模型验证的关键信息进行提取,实现对物理系统的建模,并基于主动学习和 Baum-Welch 算法对马尔可夫决策过程和马尔可夫链进行学习,最终证明了该种方法可以显著减少建模所需的观测次数。