Nov, 2024

强鲁棒马克ov决策过程:人工智能与形式方法的交汇点

TL;DR本研究针对传统马克ov决策过程在转移概率需要精确已知这一限制假设的缺陷,提出了强鲁棒马克ov决策过程(RMDPs),允许转移概率属于某个不确定性集合。文章提供了RMDPs的基本教学,探讨了其语义和解决方法,以及与其他模型的关系,展示了RMDPs在强化学习和抽象技术等多个领域的应用潜力。