Sep, 2022

将深度强化学习模型提炼成可解释的神经 - 模糊系统

TL;DR本文提出了一种使用深度强化学习中的策略来压缩神经模糊控制器的算法,该方法通过蒸馏将深度神经网络里的模型精华提取并转化成较小的规则库,可以在保持灵活性的同时,提升模型的可解释性。作者在 OpenAI Gym 上进行了测试,取得与深度强化学习相当的表现,但只需 2 至 6 条模糊规则。