May, 2023

解释性和简洁的遗传模糊系统强化学习策略

TL;DR本文介绍了一种名为 Fuzzy MoCoCo 的基于模糊规则的政策演化系统,它利用多目标和合作协同机制,通过在连续状态 RL 环境 Mountain Car 上测试,结果表明该系统能够有效地探索政策性能和复杂性之间的平衡,并学习使用尽可能少的规则的可解释和高性能政策。